Integració de l'API de SpeechGen amb Make.com: Automatitza els fluxos de treball de text a veu

, 27-10-2025

Simplifica la creació de contingut de veu: Integració de SpeechGen.io amb Make.com. Aquesta publicació del blog us guiarà a través de la integració del servei d'automatització Make.com (abans Integromat) amb el nostre servei de síntesi de veu basat en xarxes neuronals, SpeechGen.io. Aquesta integració permet l'automatització dels processos de text a veu, fent la creació de contingut més fàcil i eficient.

Com funciona

Cobrim dos mètodes basats en la longitud del text que voleu convertir a veu:

  1. Per a textos de fins a 2000 caràcters: Aquest mètode implica una sol·licitud ràpida i la recepció immediata de la sortida de veu. És perfecte per a textos curts que necessiten ser convertits ràpidament.

  2. Per a textos de més de 2000 caràcters: Aquest mètode utilitza dues sol·licituds. La primera sol·licitud envia el text amb la configuració de veu per a la conversió. La segona sol·licitud, que s'ha de fer no abans d'un minut, recupera el fitxer d'àudio acabat. Aquest enfocament garanteix que els textos més llargs es processin de manera eficient sense sobrecarregar el sistema.

Per què utilitzar Make.com?

Make.com facilita l'automatització d'aquests processos sense la necessitat de coneixements tècnics profunds. Podeu configurar activadors per iniciar automàticament el procés de text a veu quan es compleixen certes condicions, com ara l'addició de nou text al vostre CMS o base de dades.

Començar

Per començar amb la integració, haureu de familiaritzar-vos amb la nostra API. Podeu trobar tota la informació necessària, inclosa la documentació i les preguntes freqüents, a Preguntes freqüents de l'API de SpeechGen.io.

Guia de vídeo completa

1. Mètode de text curt

En aquesta publicació del blog aprendrem a generar un fitxer Mp3 a partir de text utilitzant SpeechGen, i després pujar aquest fitxer Mp3 a DropBox.

Podeu descarregar i importar el json del projecte de demostració que es mostra en aquest blog i utilitzar-lo.

1. Requisits

2. Obteniu la vostra clau API de SpeechGen

  1. Inicieu sessió al vostre perfil de SpeechGen.io
  2. Navegueu al vostre perfil
  3. Reveleu i copieu la vostra clau API. La utilitzarem més tard.

Clau API de Speechgen

3. Creeu un nou escenari

Inicieu sessió a Make.com i feu clic a "Crea un nou escenari".

Crea un nou escenari

4. Afegeix un nou mòdul

Afegeix un nou mòdul

5. Seleccioneu HTTP

Cerqueu "HTTP" i seleccioneu "HTTP" de la llista de mòduls disponibles.

Seleccioneu HTTP de la llista

6. Seleccioneu Fer una sol·licitud

Seleccioneu Fer una sol·licitud

7. Introduïu l'URL

Introduïu l'URL com a https://speechgen.io/index.php?r=api/text

Després feu clic a "Afegeix paràmetre" per afegir paràmetres de consulta a la nostra sol·licitud

Introduïu l'URL

8. Inseriu 3 paràmetres més

Hem d'introduir 4 paràmetres en total, així que n'afegim 3 més.

Afegeix 3 paràmetres més

9. Introduïu els paràmetres requerits

Introduïu els paràmetres requerits

  • token = El token API que heu copiat del pas 2
  • email = El correu electrònic associat al vostre compte de SpeechGen
  • voice = El nom exacte de la veu, podeu triar la veu que us agradi de la llista completa de veus i copiar el nom de la veu des d'allà. Veus de l'API JSON https://speechgen.io/index.php?r=api/voices.
  • text = El text que voleu convertir en veu. Per exemple, enganxaré aquest text: "Una solució pràctica per crear veus en off, materials d'e-learning i publicitat. Genereu veu a partir de text en diversos idiomes i accents. Personalitzeu la configuració de veu per satisfer necessitats específiques".

10. Feu clic a OK per desar els canvis

OK per desar els canvis

11. Executeu el vostre escenari

Ara és el moment d'executar i provar el vostre escenari.

Executeu el vostre escenari

12. Feu clic a la bombolla

Feu clic a aquesta bombolla per veure el resultat de la vostra sol·licitud.

Feu clic a la bombolla

Centreu-vos en la part de sortida, veureu 'Data'.

Podeu veure 'file' que és l'URL del fitxer Mp3 generat del nostre text

fitxer Mp3 generat

Si navegueu a aquesta URL, podeu reproduir i descarregar el fitxer Mp3.

Per fer que les dades de SpeechGen siguin fàcilment accessibles per altres mòduls, podem afegir un altre mòdul al nostre escenari.

14. Afegeix un altre mòdul

Passeu el ratolí al costat del primer mòdul que tenim, veureu un botó de més, feu-hi clic

mòdul següent

15. Seleccioneu l'opció 'JSON'

Cerqueu 'JSON' i seleccioneu aquesta opció.

Seleccioneu json

16. Trieu Analitzar JSON

Després seleccioneu "Analitzar JSON" perquè puguem exportar les dades de SpeechGen a múltiples variables que podem utilitzar en el nostre escenari.

Seleccioneu Analitzar JSON

17. Introduïu 'Data'

Feu clic aquí (cadena JSON) per introduir 'Data' del mòdul HTTP anterior

Introduïu Dades

18. Feu clic a 'Data'

Feu clic a 'Data' per afegir-la al camp i feu clic a OK per desar els canvis.

Feu clic a Dades

19. Executa una vegada

Feu clic a 'Executa una vegada' per executar l'escenari.

Feu clic a Executa una vegada per executar l'escenari

Seleccioneu 'Executa de totes maneres' per forçar Make a executar l'escenari.

Executa de totes maneres

Això és perquè JSON no hauria de ser l'últim mòdul de l'escenari, ja que transforma les dades d'un altre mòdul i no estem fent res amb aquestes dades, en aquest cas només volem veure les dades primer, i després decidir què fer amb elles.

20. Feu clic a la bombolla

Feu clic a la bombolla sobre el mòdul JSON per veure les dades que hem obtingut.

Feu clic a la bombolla sobre el mòdul JSON

Ara les dades que estaven totes sota 'Data' estan ara en variables individuals que podem utilitzar en els següents mòduls...

També podeu observar la variable 'file' que tenia l'URL del fitxer Mp3 generat que utilitzarem en el següent mòdul.

Observeu el fitxer

Ara pujarem el fitxer Mp3 generat a Dropbox, per fer-ho primer hem de descarregar el fitxer Mp3 en aquest escenari.

21. Afegeix un altre mòdul HTTP per descarregar el fitxer

Afegeix un altre mòdul HTTP

Seleccioneu Obtenir fitxer perquè puguem descarregar el fitxer Mp3 dins de l'escenari.

Seleccioneu Obtenir fitxer

La majoria de mòduls només requereixen l'URL, però Dropbox requereix l'entrada directa de les dades reals del fitxer.

22. Mapeja la variable 'file'

Mapeja la variable 'file', que és l'URL que podem utilitzar per obtenir el fitxer.

Mapeja la variable del fitxer

23. Mòdul de Dropbox

Després afegirem el mòdul de Dropbox.

Mòdul de Dropbox

24. Seleccioneu Pujar fitxer

Seleccioneu Pujar fitxer

Trieu la carpeta on desar dins del vostre Dropbox, després trieu Map per poder canviar el nom del fitxer Mp3 pujat.

Fitxer

Assegureu-vos d'afegir l'extensió de fitxer '.mp3' al final del nom, perquè sigui més fàcil per a Dropbox reconèixer-lo com un fitxer Mp3 que podeu reproduir.

Fitxer Mp3

Després d'executar l'escenari, tenim el fitxer pujat a Dropbox

El fitxer pujat a Dropbox

Procés complet per al primer mètode

Una previsualització de tot el procés

  1. HTTP: Genera l'àudio a partir de text utilitzant SpeechGen.io
  2. JSON: Analitza les dades que obtenim de l'API de SpeechGen
  3. HTTP: Obté les dades binàries del fitxer generat
  4. Dropbox: Puja aquestes dades a Dropbox

2. Mètode de text llarg

Ara, estem utilitzant l'API de text llarg de SpeechGen per generar un TTS llarg.

El segon mètode està dissenyat per a textos de més de 2000 caràcters. A diferència del primer mètode, que converteix ràpidament textos curts en veu, aquest enfocament implica dos passos a causa del temps de processament requerit per a textos més llargs.

  1. Sol·licitud inicial: Envieu el text amb la configuració de veu escollida per iniciar el procés de conversió.
  2. Sol·licitud de seguiment: Després d'esperar almenys un minut, feu una altra sol·licitud per recuperar el fitxer d'àudio acabat. Aquest retard garanteix que el sistema tingui prou temps per processar el text més llarg sense problemes.

La principal diferència amb el primer mètode és la necessitat d'una segona sol·licitud a causa del temps de processament més llarg. Aquest mètode garanteix una gestió eficient de textos extensos, fent-lo adequat per crear contingut d'àudio més llarg.

Després pujarem el fitxer a Dropbox com a demostració, però les opcions són infinites sobre com podeu utilitzar aquesta API de TTS.

Podeu descarregar i importar el plànol de demostració per a textos llargs en format json que es mostra en aquest blog i utilitzar-lo.

1. Requisits

2. Obteniu la vostra clau API de SpeechGen

  1. Inicieu sessió al vostre perfil de SpeechGen.io
  2. Navegueu al vostre perfil
  3. Reveleu i copieu la vostra clau API. La utilitzarem més tard.

Clau API de Speechgen

3. Creeu un nou escenari

Inicieu sessió a Make.com i feu clic a "Crea un nou escenari".

Crea un nou escenari

4. Afegeix un nou mòdul

Afegeix un nou mòdul

5. Seleccioneu HTTP

Cerqueu "HTTP" i seleccioneu "HTTP" de la llista de mòduls disponibles.

Select HTTP from the list

6. Seleccioneu "Make a request" (Fer una sol·licitud)

Select Make a request

7. Introduïu l'URL

Introduïu l'URL com a https://speechgen.io/index.php?r=api/longtext

Després, feu clic a "Add parameter" (Afegir paràmetre) per afegir paràmetres de consulta a la nostra sol·licitud.

Input URL

8. Introduïu 4 paràmetres 

Hem d'introduir 4 paràmetres en total, així que n'afegirem 3 més.

Add parameter 3 more

9. Introduïu els paràmetres requerits

Input the required parameters

  • token = El testimoni de l'API que vau copiar del pas 2.
  • email = El correu electrònic associat al vostre compte de SpeechGen del pas 2.
  • voice = El nom exacte de la veu. Podeu triar la veu que vulgueu de la llista completa de veus i copiar-ne el nom des d'allà. Veus de l'API JSON https://speechgen.io/index.php?r=api/voices.
  • text = El text que voleu convertir en veu.

10. Feu clic a "OK" per desar els canvis

11. Executar

Ara és el moment d'executar i provar el vostre escenari.

Run your scenario

12. Feu clic a la bombolla

Feu clic a aquesta bombolla per veure el resultat de la vostra sol·licitud.

Click on the bubble

Centre-vos en la part de sortida. Hi veureu "Data".

Podeu veure "id", que és l'ID de la nostra sol·licitud.

File ID

Ara, per fer que les dades de SpeechGen siguin fàcilment accessibles per altres mòduls, podem afegir un altre mòdul al nostre escenari.

13. Afegiu un altre mòdul

Passeu el ratolí al costat del primer mòdul que tenim, veureu un botó amb un signe més, feu-hi clic.

next  module

14. Afegiu JSON

Cerqueu "JSON" i seleccioneu aquesta opció.

Select json

Després, seleccioneu "Parse JSON" (Analitzar JSON) perquè puguem exportar les dades de SpeechGen a múltiples variables que podem utilitzar en el nostre escenari.

Select Parse JSON

15. Introduïu "Data"

Feu clic aquí per introduir "Data" del mòdul HTTP anterior.

Tnput Data

16. Feu clic a "Data"

Feu clic a "Data" per afegir-lo al camp i feu clic a "OK" per desar els canvis.

Click Data

17. Executar una vegada

Feu clic a "Run Once" (Executar una vegada) per executar l'escenari.

Click Run Once to execute the Scenario

Seleccioneu "Run Anyway" (Executar de totes maneres) per forçar Make a executar l'escenari.

Run Anyway

Això és perquè JSON no hauria de ser l'últim mòdul de l'escenari, ja que transforma les dades d'un altre mòdul i no estem fent res amb aquestes dades. En aquest cas, només volem veure les dades primer i després decidir què fer-ne.

18. Feu clic a la bombolla

Feu clic a la bombolla que hi ha a sobre del mòdul JSON per veure les dades que hem obtingut.

Click the bubble above the JSON module

Ara, les dades que estaven totes sota "Data" es troben en variables individuals que podem utilitzar en els mòduls següents.

També podeu observar la variable "ID" que utilitzarem en els propers passos per obtenir l'URL del nostre fitxer TTS.

TTS File URL

19. Afegiu un mòdul SLEEP

Afegiu un mòdul SLEEP per esperar que es generi el TTS.

Sleep

Click on the SLEEP

20. Configureu el SLEEP

Configureu la durada del SLEEP entre 1 i 5 minuts (60-300 segons).

Per a la nostra demostració, la farem de 200 segons.

Set the SLEEP Duration

Ara, pujarem el fitxer Mp3 generat a Dropbox. Per fer-ho, primer hem de descarregar el fitxer Mp3 en aquest escenari.

21. Afegiu un altre mòdul HTTP

Afegiu un altre mòdul HTTP per obtenir el TTS generat.

Get the Generated TTS

Introduïu els paràmetres necessaris:

  • token = El testimoni de l'API que vau copiar del pas 2.
  • email = El correu electrònic associat al vostre compte de SpeechGen del pas 2.
  • id = L'ID del TTS de la primera sol·licitud [Analitzar JSON, pas 2].

22. Mapeig de l'ID del mòdul JSON

Mapping the id from the JSON module

23. Obteniu les dades 

Executeu l'escenari per obtenir les dades i afegiu un altre mòdul "Parse JSON" (Analitzar JSON).

Parse JSON module

Mapegeu "Data" del mòdul HTTP anterior.

23. Executeu l'escenari una vegada més

Executeu l'escenari una vegada més per obtenir dades de l'últim mòdul "Parse JSON", i després afegiu un altre mòdul HTTP per descarregar el fitxer.

Add another HTTP Module

24. Seleccioneu "Get File" (Obtenir fitxer)

Seleccioneu "Get File" perquè puguem descarregar el fitxer Mp3 dins de l'escenari.

Select Get File

La majoria de mòduls només requereixen l'URL, però Dropbox requereix una entrada directa de les dades reals del fitxer.

25. Mapegeu la variable "file"

Mapegeu la variable "file", que és l'URL que podem utilitzar per obtenir el fitxer.

Map the file variable

26. Després afegirem el mòdul de Dropbox

DropBox module

27. Seleccioneu "Upload file" (Pujar fitxer)

Select Upload file

Trieu la carpeta on desar-lo dins del vostre Dropbox, i després trieu "Map" (Mapejar) perquè puguem canviar el nom del fitxer Mp3 pujat.

File

Assegureu-vos d'afegir l'extensió de fitxer ".mp3" al final del nom, perquè sigui més fàcil per a Dropbox reconèixer-lo com un fitxer Mp3 que podeu reproduir.

Mp3 file

Després d'executar l'escenari, tenim el fitxer pujat a Dropbox.

The File uploaded to DropBox

Procés complet per a un mètode 2D

Scheme of the process

  1. HTTP: Generar l'àudio a partir de text utilitzant SpeechGen.io.
  2. JSON: Analitzar les dades que obtenim de l'API de SpeechGen.
  3. SLEEP: Esperar uns minuts fins que el TTS estigui llest.
  4. HTTP: Sol·licitar el fitxer mp3 utilitzant el seu ID.
  5. JSON: Analitzar les dades com ho vam fer abans.
  6. HTTP: Obtenir dades binàries del fitxer generat.
  7. Dropbox: Pujar aquestes dades a Dropbox.

Conclusió

La integració de SpeechGen.io amb Make.com obre grans possibilitats per automatitzar la creació de contingut de veu. L'automatització de la síntesi de veu pot ser útil per a:

  • Crear versions d'àudio d'articles o blocs.
  • Generar notificacions de veu per als clients.
  • Produir materials educatius i de formació en format d'àudio.
  • Millorar el servei al client amb respostes de veu.

Tant si es tracta de notificacions breus com de materials educatius extensos, la nostra guia us ajudarà a configurar un procés eficient amb un esforç mínim. Transformeu el vostre text en veu viva de manera automàtica, fent que el vostre contingut sigui més accessible i atractiu per a una àmplia audiència.

Utilitzem cookies per a assegurar-nos que obtinguis la millor experiència en el nostre lloc web. Més informació: Política de privacitat

Acceptar Cookies