Integrazione dell'API SpeechGen con Make.com: Automatizza i flussi di lavoro Text-to-Speech

, 27-10-2025

Semplifica la creazione di contenuti vocali: Integrare SpeechGen.io con Make.com. Questo post del blog ti guida nell'integrazione del servizio di automazione Make.com (precedentemente Integromat) con il nostro servizio di sintesi vocale basato su reti neurali, SpeechGen.io. Questa integrazione consente l'automazione dei processi text-to-speech, rendendo la creazione di contenuti più facile ed efficiente.

Come funziona

Trattiamo due metodi basati sulla lunghezza del testo che desideri convertire in voce:

  1. Per testi fino a 2000 caratteri: Questo metodo prevede una richiesta rapida e la ricezione immediata dell'output vocale. È perfetto per testi brevi che devono essere convertiti rapidamente.

  2. Per testi oltre 2000 caratteri: Questo metodo utilizza due richieste. La prima richiesta invia il testo con le impostazioni vocali per la conversione. La seconda richiesta, che dovrebbe essere fatta non prima di un minuto, recupera il file audio finito. Questo approccio garantisce che i testi più lunghi vengano elaborati in modo efficiente senza sovraccaricare il sistema.

Perché usare Make.com?

Make.com facilita l'automazione di questi processi senza la necessità di profonde conoscenze tecniche. Puoi impostare trigger per avviare automaticamente il processo text-to-speech quando vengono soddisfatte determinate condizioni, come l'aggiunta di nuovo testo al tuo CMS o database.

Per iniziare

Per iniziare con l'integrazione, dovrai familiarizzare con la nostra API. Puoi trovare tutte le informazioni necessarie, inclusa la documentazione e le FAQ, su SpeechGen.io API FAQ.

Guida video completa

1. Metodo per testi brevi

In questo post del blog impareremo come generare un file Mp3 da testo usando SpeechGen, quindi caricare quel file Mp3 su DropBox.

Puoi scaricare e importare il json del progetto demo mostrato in questo blog e usarlo.

1. Requisiti

2. Ottieni la tua chiave API SpeechGen

  1. Accedi al tuo profilo SpeechGen.io
  2. Vai al tuo profilo
  3. Mostra e copia la tua chiave API. La useremo più tardi.

Chiave API Speechgen

3. Crea un nuovo scenario

Accedi a Make.com e clicca su "Crea un nuovo scenario".

Crea un nuovo scenario

4. Aggiungi un nuovo modulo

Aggiungi un nuovo modulo

5. Seleziona HTTP

Cerca "HTTP" e seleziona "HTTP" dall'elenco dei moduli disponibili.

Seleziona HTTP dall'elenco

6. Seleziona Effettua una richiesta

Seleziona Effettua una richiesta

7. Inserisci URL

Inserisci l'URL come https://speechgen.io/index.php?r=api/text

Quindi clicca su "Aggiungi parametro" per aggiungere i parametri di query alla nostra richiesta

Inserisci URL

8. Inserisci altri 3 parametri

Dobbiamo inserire 4 parametri in totale, quindi aggiungiamone altri 3.

Aggiungi altri 3 parametri

9. Inserisci i parametri richiesti

Inserisci i parametri richiesti

  • token = Il token API che hai copiato dal Passaggio 2
  • email = L'email associata al tuo account SpeechGen
  • voice = Il nome esatto della voce, puoi scegliere la voce che preferisci dall'elenco completo delle voci e copiare il nome della voce da lì. Voci API JSON https://speechgen.io/index.php?r=api/voices.
  • text = Il testo che vuoi trasformare in voce. Ad esempio, incollerò questo testo: "Una soluzione pratica per creare voiceover, materiali e-learning e pubblicità. Genera voce da testo in più lingue e accenti. Personalizza le impostazioni vocali per soddisfare esigenze specifiche".

10. Clicca su OK per salvare le modifiche

OK per salvare le modifiche

11. Esegui il tuo scenario

Ora è il momento di eseguire e testare il tuo scenario.

Esegui il tuo scenario

12. Clicca sulla bolla

Clicca su questa bolla per vedere il risultato della tua richiesta.

Clicca sulla bolla

Concentrati sulla parte di output, vedrai "Data".

Puoi vedere "file" che è l'URL del file Mp3 generato dal nostro testo

file Mp3 generato

Se navighi a questo URL, puoi riprodurre e scaricare il file Mp3.

Per rendere i dati di SpeechGen facilmente accessibili da altri moduli, possiamo aggiungere un altro modulo al nostro scenario.

14. Aggiungi un altro modulo

Passa il mouse accanto al primo modulo che abbiamo, vedrai un pulsante più, cliccaci sopra

modulo successivo

15. Seleziona l'opzione 'JSON'

Cerca 'JSON' e seleziona questa opzione.

Seleziona json

16. Scegli Analizza JSON

Quindi seleziona "Analizza JSON" in modo da poter esportare i dati da SpeechGen in più variabili che possiamo usare nel nostro scenario.

Seleziona Analizza JSON

17. Inserisci 'Data'

Clicca qui (stringa JSON) per inserire 'Data' dal precedente modulo HTTP

Inserisci Data

18. Clicca 'Data'

Clicca 'Data' per aggiungerlo al campo e clicca OK per salvare le modifiche.

Clicca Data

19. Esegui una volta

Clicca 'Esegui una volta' per eseguire lo scenario.

Clicca Esegui una volta per eseguire lo scenario

Seleziona 'Esegui comunque' per forzare Make a eseguire lo scenario.

Esegui comunque

Questo perché JSON non dovrebbe essere l'ultimo modulo nello scenario, poiché trasforma i dati da un altro modulo e non stiamo facendo nulla con quei dati, in questo caso vogliamo solo vedere i dati prima, quindi decidere cosa farne.

20. Clicca sulla bolla

Clicca sulla bolla sopra il modulo JSON per vedere i dati che abbiamo ottenuto.

Clicca sulla bolla sopra il modulo JSON

Ora i dati che erano tutti sotto 'Data' sono ora in variabili individuali che possiamo usare nei moduli successivi...

Puoi anche notare la variabile 'file' che conteneva l'URL del file Mp3 generato che useremo nel modulo successivo.

Nota il file

Ora carichiamo il file Mp3 generato su Dropbox, per farlo dobbiamo prima scaricare il file Mp3 in questo scenario.

21. Aggiungi un altro modulo HTTP per scaricare il file

Aggiungi un altro modulo HTTP

Seleziona Ottieni file in modo da poter scaricare il file Mp3 all'interno dello scenario.

Seleziona Ottieni file

La maggior parte dei moduli richiede solo l'URL, ma DropBox richiede l'input diretto dei dati effettivi del file.

22. Mappa la variabile 'file'

Mappa la variabile 'file', che è l'URL che possiamo usare per ottenere il file.

Mappa la variabile file

23. Modulo DropBox

Quindi aggiungeremo il modulo DropBox.

Modulo DropBox

24. Seleziona Carica file

Seleziona Carica file

Scegli la cartella in cui salvare all'interno del tuo Dropbox, quindi scegli Mappa in modo da poter cambiare il nome del file Mp3 caricato.

File

Assicurati di aggiungere l'estensione del file '.mp3' alla fine del nome, in modo che sia più facile per Dropbox riconoscerlo come un file Mp3 che puoi riprodurre.

File Mp3

Dopo aver eseguito lo scenario, abbiamo il file caricato su DropBox

Il file caricato su DropBox

Processo completo per il 1° metodo

Un'anteprima dell'intero processo

  1. HTTP: Genera l'audio dal testo usando SpeechGen.io
  2. JSON: Analizza i dati che otteniamo dall'API SpeechGen
  3. HTTP: Ottieni i dati binari del file generato
  4. Dropbox: Carica quei dati su Dropbox

2. Metodo per testi lunghi

Ora, stiamo utilizzando l'API per testi lunghi di SpeechGen per generare un TTS lungo.

Il secondo metodo è progettato per testi più lunghi di 2000 caratteri. A differenza del primo metodo, che converte rapidamente testi brevi in voce, questo approccio prevede due passaggi a causa del tempo di elaborazione richiesto per testi più lunghi.

  1. Richiesta iniziale: Invii il testo con le impostazioni vocali scelte per avviare il processo di conversione.
  2. Richiesta di follow-up: Dopo aver atteso almeno un minuto, effettui un'altra richiesta per recuperare il file audio finito. Questo ritardo garantisce che il sistema abbia tempo sufficiente per elaborare il testo più lungo senza problemi.

La differenza principale rispetto al primo metodo è la necessità di una seconda richiesta a causa del tempo di elaborazione più lungo. Questo metodo garantisce una gestione efficiente di testi estesi, rendendolo adatto per la creazione di contenuti audio più lunghi.

Quindi caricheremo il file su Dropbox come demo, ma le opzioni su come utilizzare questa API TTS sono infinite.

Puoi scaricare e importare il blueprint demo per testi lunghi json mostrato in questo blog e usarlo.

1. Requisiti

2. Ottieni la tua chiave API SpeechGen

  1. Accedi al tuo profilo SpeechGen.io
  2. Vai al tuo profilo
  3. Mostra e copia la tua chiave API. La useremo più tardi.

Chiave API Speechgen

3. Crea un nuovo scenario

Accedi a Make.com e clicca su "Crea un nuovo scenario".

Crea un nuovo scenario

4. Aggiungi un nuovo modulo

Aggiungi un nuovo modulo

5. Seleziona HTTP

Cerca "HTTP" e seleziona "HTTP" dall'elenco dei moduli disponibili.

Seleziona HTTP dalla lista

6. Seleziona "Make a request" (Fai una richiesta)

Seleziona Fai una richiesta

7. Inserisci l'URL

Inserisci l'URL come https://speechgen.io/index.php?r=api/longtext

Poi clicca su "Add parameter" (Aggiungi parametro) per aggiungere i parametri di query alla nostra richiesta.

Inserisci URL

8. Inserisci 4 parametri

Dobbiamo inserire un totale di 4 parametri, quindi aggiungiamone altri 3.

Aggiungi altri 3 parametri

9. Inserisci i parametri richiesti

Inserisci i parametri richiesti

  • token = Il token API che hai copiato dal Passaggio 2.
  • email = L'email associata al tuo account SpeechGen dal Passaggio 2.
  • voice = Il nome esatto della voce. Puoi scegliere la voce che preferisci dalla lista completa delle voci e copiare il nome della voce da lì. Voci API JSON https://speechgen.io/index.php?r=api/voices.
  • text = Il testo che vuoi trasformare in voce.

10. Clicca su OK per salvare le modifiche

11. Esegui

Ora è il momento di eseguire e testare il tuo scenario.

Esegui il tuo scenario

12. Clicca sulla bolla

Clicca su questa bolla per vedere il risultato della tua richiesta.

Clicca sulla bolla

Concentrati sulla parte di output, vedrai "Data".

Puoi vedere "id" che è l'ID della nostra richiesta.

ID file

Ora, per rendere i dati di SpeechGen facilmente accessibili da altri moduli, possiamo aggiungere un altro modulo al nostro scenario.

13. Aggiungi un altro modulo

Passa il mouse accanto al primo modulo che abbiamo, vedrai un pulsante più, cliccaci sopra.

modulo successivo

14. Aggiungi JSON

Cerca "JSON" e seleziona questa opzione.

Seleziona json

Poi seleziona Parse JSON in modo da poter esportare i dati da SpeechGen in più variabili che possiamo usare nel nostro scenario.

Seleziona Parse JSON

15. Inserisci "Data"

Clicca qui per inserire "Data" dal precedente modulo HTTP.

Inserisci Data

16. Clicca su "Data"

Clicca su "Data" per aggiungerlo al campo e clicca su OK per salvare le modifiche.

Clicca su Data

17. Esegui una volta

Clicca su Run Once (Esegui una volta) per eseguire lo scenario.

Clicca su Esegui una volta per eseguire lo scenario

Seleziona "Run Anyway" (Esegui comunque) per forzare Make a eseguire lo scenario.

Esegui comunque

Questo perché JSON non dovrebbe essere l'ultimo modulo nello scenario, poiché trasforma i dati da un altro modulo e non stiamo facendo nulla con quei dati; in questo caso vogliamo solo vedere i dati prima, poi decidere cosa farne.

18. Clicca sulla bolla

Clicca sulla bolla sopra il modulo JSON per vedere i dati che abbiamo ottenuto.

Clicca sulla bolla sopra il modulo JSON

Ora i dati che erano tutti sotto "Data" sono ora in variabili individuali che possiamo usare nei moduli successivi.

Puoi anche notare la variabile "ID" che useremo nei passaggi successivi per ottenere l'URL del nostro file TTS.

URL file TTS

19. Aggiungi un modulo SLEEP

Aggiungi un modulo SLEEP per attendere la generazione del TTS.

Sleep

Clicca su SLEEP

20. Imposta il SLEEP

Imposta la durata del SLEEP tra 1 e 5 minuti (60-300 secondi).

Per la nostra demo, impostiamola a 200 secondi.

Imposta la durata del SLEEP

Ora carichiamo il file Mp3 generato su Dropbox; per farlo, dobbiamo prima scaricare il file Mp3 in questo scenario.

21. Aggiungi un altro modulo HTTP

Aggiungi un altro modulo HTTP per ottenere il TTS generato.

Ottieni il TTS generato

Inserisci i parametri necessari:

  • token = Il token API che hai copiato dal Passaggio 2.
  • email = L'email associata al tuo account SpeechGen dal Passaggio 2.
  • id = L'ID del TTS dalla prima richiesta [Parse JSON, passaggio 2].

22. Mappatura dell'ID dal modulo JSON

Mappatura dell'ID dal modulo JSON

23. Ottieni i dati

Esegui lo scenario per ottenere i dati e aggiungi un altro modulo Parse JSON.

Modulo Parse JSON

Mappa "Data" dal precedente modulo HTTP.

23. Esegui lo scenario un'altra volta

Esegui lo scenario un'altra volta per ottenere i dati dall'ultimo modulo Parse JSON, quindi aggiungi un altro modulo HTTP per scaricare il file.

Aggiungi un altro modulo HTTP

24. Seleziona "Get File" (Ottieni file)

Seleziona "Get File" in modo da poter scaricare il file Mp3 all'interno dello scenario.

Seleziona Ottieni file

La maggior parte dei moduli richiede solo l'URL, ma Dropbox richiede l'input diretto dei dati effettivi del file.

25. Mappa la variabile "file"

Mappa la variabile "file", che è l'URL che possiamo usare per ottenere il file.

Mappa la variabile file

26. Poi aggiungeremo il modulo Dropbox

Modulo Dropbox

27. Seleziona "Upload file" (Carica file)

Seleziona Carica file

Scegli la cartella in cui salvare all'interno del tuo Dropbox, quindi scegli "Map" (Mappa) in modo da poter cambiare il nome del file Mp3 caricato.

File

Assicurati di aggiungere l'estensione ".mp3" alla fine del nome, in modo che sia più facile per Dropbox riconoscerlo come un file Mp3 riproducibile.

File Mp3

Dopo aver eseguito lo scenario, abbiamo il File caricato su Dropbox.

Il file caricato su Dropbox

Processo completo per un metodo a 2 fasi

Schema del processo

  1. HTTP: Genera l'audio dal testo usando SpeechGen.io.
  2. JSON: Analizza i dati che otteniamo dall'API di SpeechGen.
  3. SLEEP: Attendi alcuni minuti finché il TTS non è pronto.
  4. HTTP: Richiedi il file mp3 usando il suo ID.
  5. JSON: Analizza i dati come abbiamo fatto prima.
  6. HTTP: Ottieni i dati binari del file generato.
  7. Dropbox: Carica quei dati su Dropbox.

Conclusione

L'integrazione di SpeechGen.io con Make.com apre vaste possibilità per automatizzare la creazione di contenuti vocali. L'automazione della sintesi vocale può essere utile per:

  • Creare versioni audio di articoli o blog.
  • Generare notifiche vocali per i clienti.
  • Produrre materiali didattici e di formazione in formato audio.
  • Migliorare il servizio clienti con risposte vocali.

Che tu stia gestendo brevi notifiche o lunghi materiali didattici, la nostra guida ti aiuterà a impostare un processo efficiente con il minimo sforzo. Trasforma il tuo testo in voce vivace automaticamente, rendendo i tuoi contenuti più accessibili e coinvolgenti per un vasto pubblico.

Utilizziamo i cookie per assicurarti la migliore esperienza sul nostro sito web. Ulteriori informazioni: Informativa sulla privacy

Accetta i cookie