27-10-2025 , 27-10-2025

Simplifica la creació de contingut de veu: Integració de SpeechGen.io amb Make.com. Aquesta publicació del blog us guiarà a través de la integració del servei d'automatització Make.com (abans Integromat) amb el nostre servei de síntesi de veu basat en xarxes neuronals, SpeechGen.io. Aquesta integració permet l'automatització dels processos de text a veu, fent la creació de contingut més fàcil i eficient.
Cobrim dos mètodes basats en la longitud del text que voleu convertir a veu:
Per a textos de fins a 2000 caràcters: Aquest mètode implica una sol·licitud ràpida i la recepció immediata de la sortida de veu. És perfecte per a textos curts que necessiten ser convertits ràpidament.
Per a textos de més de 2000 caràcters: Aquest mètode utilitza dues sol·licituds. La primera sol·licitud envia el text amb la configuració de veu per a la conversió. La segona sol·licitud, que s'ha de fer no abans d'un minut, recupera el fitxer d'àudio acabat. Aquest enfocament garanteix que els textos més llargs es processin de manera eficient sense sobrecarregar el sistema.
Make.com facilita l'automatització d'aquests processos sense la necessitat de coneixements tècnics profunds. Podeu configurar activadors per iniciar automàticament el procés de text a veu quan es compleixen certes condicions, com ara l'addició de nou text al vostre CMS o base de dades.
Per començar amb la integració, haureu de familiaritzar-vos amb la nostra API. Podeu trobar tota la informació necessària, inclosa la documentació i les preguntes freqüents, a Preguntes freqüents de l'API de SpeechGen.io.
En aquesta publicació del blog aprendrem a generar un fitxer Mp3 a partir de text utilitzant SpeechGen, i després pujar aquest fitxer Mp3 a DropBox.
Podeu descarregar i importar el json del projecte de demostració que es mostra en aquest blog i utilitzar-lo.

Inicieu sessió a Make.com i feu clic a "Crea un nou escenari".


Cerqueu "HTTP" i seleccioneu "HTTP" de la llista de mòduls disponibles.


Introduïu l'URL com a https://speechgen.io/index.php?r=api/text
Després feu clic a "Afegeix paràmetre" per afegir paràmetres de consulta a la nostra sol·licitud

Hem d'introduir 4 paràmetres en total, així que n'afegim 3 més.



Ara és el moment d'executar i provar el vostre escenari.

Feu clic a aquesta bombolla per veure el resultat de la vostra sol·licitud.

Centreu-vos en la part de sortida, veureu 'Data'.
Podeu veure 'file' que és l'URL del fitxer Mp3 generat del nostre text

Si navegueu a aquesta URL, podeu reproduir i descarregar el fitxer Mp3.
Per fer que les dades de SpeechGen siguin fàcilment accessibles per altres mòduls, podem afegir un altre mòdul al nostre escenari.
Passeu el ratolí al costat del primer mòdul que tenim, veureu un botó de més, feu-hi clic

Cerqueu 'JSON' i seleccioneu aquesta opció.

Després seleccioneu "Analitzar JSON" perquè puguem exportar les dades de SpeechGen a múltiples variables que podem utilitzar en el nostre escenari.

Feu clic aquí (cadena JSON) per introduir 'Data' del mòdul HTTP anterior

Feu clic a 'Data' per afegir-la al camp i feu clic a OK per desar els canvis.

Feu clic a 'Executa una vegada' per executar l'escenari.

Seleccioneu 'Executa de totes maneres' per forçar Make a executar l'escenari.

Això és perquè JSON no hauria de ser l'últim mòdul de l'escenari, ja que transforma les dades d'un altre mòdul i no estem fent res amb aquestes dades, en aquest cas només volem veure les dades primer, i després decidir què fer amb elles.
Feu clic a la bombolla sobre el mòdul JSON per veure les dades que hem obtingut.

Ara les dades que estaven totes sota 'Data' estan ara en variables individuals que podem utilitzar en els següents mòduls...
També podeu observar la variable 'file' que tenia l'URL del fitxer Mp3 generat que utilitzarem en el següent mòdul.

Ara pujarem el fitxer Mp3 generat a Dropbox, per fer-ho primer hem de descarregar el fitxer Mp3 en aquest escenari.

Seleccioneu Obtenir fitxer perquè puguem descarregar el fitxer Mp3 dins de l'escenari.

La majoria de mòduls només requereixen l'URL, però Dropbox requereix l'entrada directa de les dades reals del fitxer.
Mapeja la variable 'file', que és l'URL que podem utilitzar per obtenir el fitxer.

Després afegirem el mòdul de Dropbox.


Trieu la carpeta on desar dins del vostre Dropbox, després trieu Map per poder canviar el nom del fitxer Mp3 pujat.

Assegureu-vos d'afegir l'extensió de fitxer '.mp3' al final del nom, perquè sigui més fàcil per a Dropbox reconèixer-lo com un fitxer Mp3 que podeu reproduir.

Després d'executar l'escenari, tenim el fitxer pujat a Dropbox


Ara, estem utilitzant l'API de text llarg de SpeechGen per generar un TTS llarg.
El segon mètode està dissenyat per a textos de més de 2000 caràcters. A diferència del primer mètode, que converteix ràpidament textos curts en veu, aquest enfocament implica dos passos a causa del temps de processament requerit per a textos més llargs.
La principal diferència amb el primer mètode és la necessitat d'una segona sol·licitud a causa del temps de processament més llarg. Aquest mètode garanteix una gestió eficient de textos extensos, fent-lo adequat per crear contingut d'àudio més llarg.
Després pujarem el fitxer a Dropbox com a demostració, però les opcions són infinites sobre com podeu utilitzar aquesta API de TTS.
Podeu descarregar i importar el plànol de demostració per a textos llargs en format json que es mostra en aquest blog i utilitzar-lo.

Inicieu sessió a Make.com i feu clic a "Crea un nou escenari".


Cerqueu "HTTP" i seleccioneu "HTTP" de la llista de mòduls disponibles.


Introduïu l'URL com a https://speechgen.io/index.php?r=api/longtext
Després, feu clic a "Add parameter" (Afegir paràmetre) per afegir paràmetres de consulta a la nostra sol·licitud.

Hem d'introduir 4 paràmetres en total, així que n'afegirem 3 més.


Ara és el moment d'executar i provar el vostre escenari.

Feu clic a aquesta bombolla per veure el resultat de la vostra sol·licitud.

Centre-vos en la part de sortida. Hi veureu "Data".
Podeu veure "id", que és l'ID de la nostra sol·licitud.

Ara, per fer que les dades de SpeechGen siguin fàcilment accessibles per altres mòduls, podem afegir un altre mòdul al nostre escenari.
Passeu el ratolí al costat del primer mòdul que tenim, veureu un botó amb un signe més, feu-hi clic.

Cerqueu "JSON" i seleccioneu aquesta opció.

Després, seleccioneu "Parse JSON" (Analitzar JSON) perquè puguem exportar les dades de SpeechGen a múltiples variables que podem utilitzar en el nostre escenari.

Feu clic aquí per introduir "Data" del mòdul HTTP anterior.

Feu clic a "Data" per afegir-lo al camp i feu clic a "OK" per desar els canvis.

Feu clic a "Run Once" (Executar una vegada) per executar l'escenari.

Seleccioneu "Run Anyway" (Executar de totes maneres) per forçar Make a executar l'escenari.

Això és perquè JSON no hauria de ser l'últim mòdul de l'escenari, ja que transforma les dades d'un altre mòdul i no estem fent res amb aquestes dades. En aquest cas, només volem veure les dades primer i després decidir què fer-ne.
Feu clic a la bombolla que hi ha a sobre del mòdul JSON per veure les dades que hem obtingut.

Ara, les dades que estaven totes sota "Data" es troben en variables individuals que podem utilitzar en els mòduls següents.
També podeu observar la variable "ID" que utilitzarem en els propers passos per obtenir l'URL del nostre fitxer TTS.

Afegiu un mòdul SLEEP per esperar que es generi el TTS.


Configureu la durada del SLEEP entre 1 i 5 minuts (60-300 segons).
Per a la nostra demostració, la farem de 200 segons.

Ara, pujarem el fitxer Mp3 generat a Dropbox. Per fer-ho, primer hem de descarregar el fitxer Mp3 en aquest escenari.
Afegiu un altre mòdul HTTP per obtenir el TTS generat.

Introduïu els paràmetres necessaris:

Executeu l'escenari per obtenir les dades i afegiu un altre mòdul "Parse JSON" (Analitzar JSON).

Mapegeu "Data" del mòdul HTTP anterior.
Executeu l'escenari una vegada més per obtenir dades de l'últim mòdul "Parse JSON", i després afegiu un altre mòdul HTTP per descarregar el fitxer.

Seleccioneu "Get File" perquè puguem descarregar el fitxer Mp3 dins de l'escenari.

La majoria de mòduls només requereixen l'URL, però Dropbox requereix una entrada directa de les dades reals del fitxer.
Mapegeu la variable "file", que és l'URL que podem utilitzar per obtenir el fitxer.



Trieu la carpeta on desar-lo dins del vostre Dropbox, i després trieu "Map" (Mapejar) perquè puguem canviar el nom del fitxer Mp3 pujat.

Assegureu-vos d'afegir l'extensió de fitxer ".mp3" al final del nom, perquè sigui més fàcil per a Dropbox reconèixer-lo com un fitxer Mp3 que podeu reproduir.

Després d'executar l'escenari, tenim el fitxer pujat a Dropbox.

La integració de SpeechGen.io amb Make.com obre grans possibilitats per automatitzar la creació de contingut de veu. L'automatització de la síntesi de veu pot ser útil per a:
Tant si es tracta de notificacions breus com de materials educatius extensos, la nostra guia us ajudarà a configurar un procés eficient amb un esforç mínim. Transformeu el vostre text en veu viva de manera automàtica, fent que el vostre contingut sigui més accessible i atractiu per a una àmplia audiència.
Xat internacional de Telegram @speechgen
Suport personal en Telegram @speechgen_alex