Integració de l'API de SpeechGen amb Make.com: Automatitza els fluxos de treball de text a veu

27-10-2025 , 27-10-2025

Simplifica la creació de contingut de veu: Integració de SpeechGen.io amb Make.com. Aquesta publicació del blog us guiarà a través de la integració del servei d'automatització Make.com (abans Integromat) amb el nostre servei de síntesi de veu basat en xarxes neuronals, SpeechGen.io. Aquesta integració permet l'automatització dels processos de text a veu, fent la creació de contingut més fàcil i eficient.

Com funciona

Cobrim dos mètodes basats en la longitud del text que voleu convertir a veu:

Per a textos de fins a 2000 caràcters: Aquest mètode implica una sol·licitud ràpida i la recepció immediata de la sortida de veu. És perfecte per a textos curts que necessiten ser convertits ràpidament.
Per a textos de més de 2000 caràcters: Aquest mètode utilitza dues sol·licituds. La primera sol·licitud envia el text amb la configuració de veu per a la conversió. La segona sol·licitud, que s'ha de fer no abans d'un minut, recupera el fitxer d'àudio acabat. Aquest enfocament garanteix que els textos més llargs es processin de manera eficient sense sobrecarregar el sistema.

Per què utilitzar Make.com?

Make.com facilita l'automatització d'aquests processos sense la necessitat de coneixements tècnics profunds. Podeu configurar activadors per iniciar automàticament el procés de text a veu quan es compleixen certes condicions, com ara l'addició de nou text al vostre CMS o base de dades.

Començar

Per començar amb la integració, haureu de familiaritzar-vos amb la nostra API. Podeu trobar tota la informació necessària, inclosa la documentació i les preguntes freqüents, a Preguntes freqüents de l'API de SpeechGen.io.

Guia de vídeo completa

1. Mètode de text curt

En aquesta publicació del blog aprendrem a generar un fitxer Mp3 a partir de text utilitzant SpeechGen, i després pujar aquest fitxer Mp3 a DropBox.

Podeu descarregar i importar el json del projecte de demostració que es mostra en aquest blog i utilitzar-lo.

1. Requisits

2. Obteniu la vostra clau API de SpeechGen

Inicieu sessió al vostre perfil de SpeechGen.io
Navegueu al vostre perfil
Reveleu i copieu la vostra clau API. La utilitzarem més tard.

Clau API de Speechgen

3. Creeu un nou escenari

Inicieu sessió a Make.com i feu clic a "Crea un nou escenari".

Crea un nou escenari

4. Afegeix un nou mòdul

Afegeix un nou mòdul

5. Seleccioneu HTTP

Cerqueu "HTTP" i seleccioneu "HTTP" de la llista de mòduls disponibles.

Seleccioneu HTTP de la llista

6. Seleccioneu Fer una sol·licitud

Seleccioneu Fer una sol·licitud

7. Introduïu l'URL

Introduïu l'URL com a https://speechgen.io/index.php?r=api/text

Després feu clic a "Afegeix paràmetre" per afegir paràmetres de consulta a la nostra sol·licitud

Introduïu l'URL

8. Inseriu 3 paràmetres més

Hem d'introduir 4 paràmetres en total, així que n'afegim 3 més.

Afegeix 3 paràmetres més

9. Introduïu els paràmetres requerits

Introduïu els paràmetres requerits

token = El token API que heu copiat del pas 2
email = El correu electrònic associat al vostre compte de SpeechGen
voice = El nom exacte de la veu, podeu triar la veu que us agradi de la llista completa de veus i copiar el nom de la veu des d'allà. Veus de l'API JSON https://speechgen.io/index.php?r=api/voices.
text = El text que voleu convertir en veu. Per exemple, enganxaré aquest text: "Una solució pràctica per crear veus en off, materials d'e-learning i publicitat. Genereu veu a partir de text en diversos idiomes i accents. Personalitzeu la configuració de veu per satisfer necessitats específiques".

10. Feu clic a OK per desar els canvis

OK per desar els canvis

11. Executeu el vostre escenari

Ara és el moment d'executar i provar el vostre escenari.

Executeu el vostre escenari

12. Feu clic a la bombolla

Feu clic a aquesta bombolla per veure el resultat de la vostra sol·licitud.

Feu clic a la bombolla

Centreu-vos en la part de sortida, veureu 'Data'.

Podeu veure 'file' que és l'URL del fitxer Mp3 generat del nostre text

fitxer Mp3 generat

Si navegueu a aquesta URL, podeu reproduir i descarregar el fitxer Mp3.

Per fer que les dades de SpeechGen siguin fàcilment accessibles per altres mòduls, podem afegir un altre mòdul al nostre escenari.

14. Afegeix un altre mòdul

Passeu el ratolí al costat del primer mòdul que tenim, veureu un botó de més, feu-hi clic

mòdul següent

15. Seleccioneu l'opció 'JSON'

Cerqueu 'JSON' i seleccioneu aquesta opció.

Seleccioneu json

16. Trieu Analitzar JSON

Després seleccioneu "Analitzar JSON" perquè puguem exportar les dades de SpeechGen a múltiples variables que podem utilitzar en el nostre escenari.

Seleccioneu Analitzar JSON

17. Introduïu 'Data'

Feu clic aquí (cadena JSON) per introduir 'Data' del mòdul HTTP anterior

Introduïu Dades

18. Feu clic a 'Data'

Feu clic a 'Data' per afegir-la al camp i feu clic a OK per desar els canvis.

Feu clic a Dades

19. Executa una vegada

Feu clic a 'Executa una vegada' per executar l'escenari.

Feu clic a Executa una vegada per executar l'escenari

Seleccioneu 'Executa de totes maneres' per forçar Make a executar l'escenari.

Executa de totes maneres

Això és perquè JSON no hauria de ser l'últim mòdul de l'escenari, ja que transforma les dades d'un altre mòdul i no estem fent res amb aquestes dades, en aquest cas només volem veure les dades primer, i després decidir què fer amb elles.

20. Feu clic a la bombolla

Feu clic a la bombolla sobre el mòdul JSON per veure les dades que hem obtingut.

Feu clic a la bombolla sobre el mòdul JSON

Ara les dades que estaven totes sota 'Data' estan ara en variables individuals que podem utilitzar en els següents mòduls...

També podeu observar la variable 'file' que tenia l'URL del fitxer Mp3 generat que utilitzarem en el següent mòdul.

Observeu el fitxer

Ara pujarem el fitxer Mp3 generat a Dropbox, per fer-ho primer hem de descarregar el fitxer Mp3 en aquest escenari.

21. Afegeix un altre mòdul HTTP per descarregar el fitxer

Afegeix un altre mòdul HTTP

Seleccioneu Obtenir fitxer perquè puguem descarregar el fitxer Mp3 dins de l'escenari.

Seleccioneu Obtenir fitxer

La majoria de mòduls només requereixen l'URL, però Dropbox requereix l'entrada directa de les dades reals del fitxer.

22. Mapeja la variable 'file'

Mapeja la variable 'file', que és l'URL que podem utilitzar per obtenir el fitxer.

Mapeja la variable del fitxer

23. Mòdul de Dropbox

Després afegirem el mòdul de Dropbox.

Mòdul de Dropbox

24. Seleccioneu Pujar fitxer

Seleccioneu Pujar fitxer

Trieu la carpeta on desar dins del vostre Dropbox, després trieu Map per poder canviar el nom del fitxer Mp3 pujat.

Fitxer

Assegureu-vos d'afegir l'extensió de fitxer '.mp3' al final del nom, perquè sigui més fàcil per a Dropbox reconèixer-lo com un fitxer Mp3 que podeu reproduir.

Fitxer Mp3

Després d'executar l'escenari, tenim el fitxer pujat a Dropbox

El fitxer pujat a Dropbox

Procés complet per al primer mètode

Una previsualització de tot el procés

HTTP: Genera l'àudio a partir de text utilitzant SpeechGen.io
JSON: Analitza les dades que obtenim de l'API de SpeechGen
HTTP: Obté les dades binàries del fitxer generat
Dropbox: Puja aquestes dades a Dropbox

2. Mètode de text llarg

Ara, estem utilitzant l'API de text llarg de SpeechGen per generar un TTS llarg.

El segon mètode està dissenyat per a textos de més de 2000 caràcters. A diferència del primer mètode, que converteix ràpidament textos curts en veu, aquest enfocament implica dos passos a causa del temps de processament requerit per a textos més llargs.

Sol·licitud inicial: Envieu el text amb la configuració de veu escollida per iniciar el procés de conversió.
Sol·licitud de seguiment: Després d'esperar almenys un minut, feu una altra sol·licitud per recuperar el fitxer d'àudio acabat. Aquest retard garanteix que el sistema tingui prou temps per processar el text més llarg sense problemes.

La principal diferència amb el primer mètode és la necessitat d'una segona sol·licitud a causa del temps de processament més llarg. Aquest mètode garanteix una gestió eficient de textos extensos, fent-lo adequat per crear contingut d'àudio més llarg.

Després pujarem el fitxer a Dropbox com a demostració, però les opcions són infinites sobre com podeu utilitzar aquesta API de TTS.

Podeu descarregar i importar el plànol de demostració per a textos llargs en format json que es mostra en aquest blog i utilitzar-lo.