Integración de la API de SpeechGen con Make.com: Automatiza flujos de trabajo de texto a voz

, 27-10-2025

Simplifica la creación de contenido de voz: Integrando SpeechGen.io con Make.com. Esta publicación de blog te guía a través de la integración del servicio de automatización Make.com (anteriormente Integromat) con nuestro servicio de síntesis de voz basado en redes neuronales, SpeechGen.io. Esta integración permite la automatización de los procesos de texto a voz, haciendo que la creación de contenido sea más fácil y eficiente.

Cómo funciona

Cubrimos dos métodos basados en la longitud del texto que deseas convertir a voz:

  1. Para textos de hasta 2000 caracteres: Este método implica una solicitud rápida y la recepción inmediata de la salida de voz. Es perfecto para textos cortos que necesitan ser convertidos rápidamente.

  2. Para textos de más de 2000 caracteres: Este método utiliza dos solicitudes. La primera solicitud envía el texto con la configuración de voz para la conversión. La segunda solicitud, que debe hacerse no antes de un minuto después, recupera el archivo de audio terminado. Este enfoque asegura que los textos más largos se procesen de manera eficiente sin sobrecargar el sistema.

¿Por qué usar Make.com?

Make.com facilita la automatización de estos procesos sin necesidad de conocimientos técnicos profundos. Puedes configurar activadores para iniciar automáticamente el proceso de texto a voz cuando se cumplan ciertas condiciones, como la adición de nuevo texto a tu CMS o base de datos.

Primeros pasos

Para comenzar con la integración, deberás familiarizarte con nuestra API. Puedes encontrar toda la información necesaria, incluyendo documentación y preguntas frecuentes, en Preguntas frecuentes de la API de SpeechGen.io.

Guía de video completa

1. Método de texto corto

En esta publicación de blog aprenderemos cómo generar un archivo Mp3 a partir de texto usando SpeechGen, y luego subir ese archivo Mp3 a DropBox.

Puedes descargar e importar el archivo json del proyecto de demostración que se muestra en este blog y usarlo.

1. Requisitos

2. Obtén tu clave API de SpeechGen

  1. Inicia sesión en tu perfil de SpeechGen.io
  2. Navega a tu perfil
  3. Revela y copia tu clave API. La usaremos más tarde.

Clave API de Speechgen

3. Crea un nuevo escenario

Inicia sesión en Make.com y haz clic en "Crear un nuevo escenario".

Crear un nuevo escenario

4. Añade un nuevo módulo

Añadir un nuevo módulo

5. Selecciona HTTP

Busca "HTTP" y selecciona "HTTP" de la lista de módulos disponibles.

Seleccionar HTTP de la lista

6. Selecciona Hacer una solicitud

Seleccionar Hacer una solicitud

7. Introduce la URL

Introduce la URL como https://speechgen.io/index.php?r=api/text

Luego haz clic en "Añadir parámetro" para añadir parámetros de consulta a nuestra solicitud.

Introducir URL

8. Inserta 3 parámetros más

Necesitamos introducir 4 parámetros en total, así que añadamos 3 más.

Añadir 3 parámetros más

9. Introduce los parámetros requeridos

Introducir los parámetros requeridos

  • token = El token API que copiaste del Paso 2
  • email = El correo electrónico asociado a tu cuenta de SpeechGen
  • voice = El nombre exacto de la voz, puedes elegir la voz que te guste de la lista completa de voces y copiar el nombre de la voz desde allí. Voces de la API JSON https://speechgen.io/index.php?r=api/voices.
  • text = El texto que quieres convertir a voz. Por ejemplo, pegaré el siguiente texto: "Una solución práctica para crear locuciones, materiales de e-learning y publicidad. Genera voz a partir de texto en varios idiomas y acentos. Personaliza la configuración de voz para satisfacer necesidades específicas".

10. Haz clic en OK para guardar los cambios

OK para guardar los cambios

11. Ejecuta tu escenario

Ahora es el momento de ejecutar y probar tu escenario.

Ejecuta tu escenario

12. Haz clic en la burbuja

Haz clic en esta burbuja para ver el resultado de tu solicitud.

Haz clic en la burbuja

Concéntrate en la parte de salida, verás 'Data'.

Puedes ver 'file' que es la URL del archivo Mp3 generado de nuestro texto.

archivo Mp3 generado

Si navegas a esta URL, puedes reproducir y descargar el archivo Mp3.

Para que los datos de SpeechGen sean fácilmente accesibles por otros módulos, podemos añadir otro módulo a nuestro escenario.

14. Añade otro módulo

Pasa el ratón junto al primer módulo que tenemos, verás un botón de más, haz clic en él.

siguiente módulo

15. Selecciona la opción 'JSON'

Busca 'JSON' y selecciona esta opción.

Seleccionar json

16. Elige Analizar JSON

Luego selecciona "Analizar JSON" para que podamos exportar los datos de SpeechGen a múltiples variables que podemos usar en nuestro escenario.

Seleccionar Analizar JSON

17. Introduce 'Data'

Haz clic aquí (cadena JSON) para introducir 'Data' del módulo HTTP anterior.

Introducir Datos

18. Haz clic en 'Data'

Haz clic en 'Data' para añadirlo al campo y haz clic en OK para guardar los cambios.

Haz clic en Datos

19. Ejecutar una vez

Haz clic en 'Ejecutar una vez' para ejecutar el escenario.

Haz clic en Ejecutar una vez para ejecutar el escenario

Selecciona 'Ejecutar de todos modos' para forzar a Make a ejecutar el escenario.

Ejecutar de todos modos

Esto se debe a que JSON no debería ser el último módulo en el escenario, ya que transforma los datos de otro módulo y no estamos haciendo nada con esos datos. En este caso, solo queremos ver los datos primero y luego decidir qué hacer con ellos.

20. Haz clic en la burbuja

Haz clic en la burbuja encima del módulo JSON para ver los datos que obtuvimos.

Haz clic en la burbuja encima del módulo JSON

Ahora los datos que estaban todos bajo 'Data' están en variables individuales que podemos usar en los siguientes módulos...

También puedes notar la variable 'file' que tenía la URL del archivo Mp3 generado que usaremos en el siguiente módulo.

Observa el archivo

Ahora subamos el archivo Mp3 generado a Dropbox. Para ello, primero necesitamos descargar el archivo Mp3 en este escenario.

21. Añade otro módulo HTTP para descargar el archivo

Añade otro módulo HTTP

Selecciona Obtener archivo para que podamos descargar el archivo Mp3 dentro del escenario.

Seleccionar Obtener archivo

La mayoría de los módulos solo requieren la URL, pero Dropbox requiere la entrada directa de los datos reales del archivo.

22. Mapea la variable 'file'

Mapea la variable 'file', que es la URL que podemos usar para obtener el archivo.

Mapea la variable de archivo

23. Módulo de Dropbox

Luego añadiremos el módulo de Dropbox.

Módulo de Dropbox

24. Selecciona Subir archivo

Seleccionar Subir archivo

Elige la carpeta donde guardar dentro de tu Dropbox, luego elige Mapear para que podamos cambiar el nombre del archivo Mp3 subido.

Archivo

Asegúrate de añadir la extensión de archivo '.mp3' al final del nombre, para que sea más fácil para Dropbox reconocerlo como un archivo Mp3 que puedes reproducir.

Archivo Mp3

Después de ejecutar el escenario, tenemos el archivo subido a Dropbox.

El archivo subido a Dropbox

Proceso completo para el primer método

Una vista previa de todo el proceso

  1. HTTP: Genera el audio a partir de texto usando SpeechGen.io
  2. JSON: Analiza los datos que obtenemos de la API de SpeechGen
  3. HTTP: Obtiene los datos binarios del archivo generado
  4. Dropbox: Sube esos datos a Dropbox

2. Método de texto largo

Ahora, estamos utilizando la API de texto largo de SpeechGen para generar un TTS largo.

El segundo método está diseñado para textos de más de 2000 caracteres. A diferencia del primer método, que convierte rápidamente textos cortos a voz, este enfoque implica dos pasos debido al tiempo de procesamiento requerido para textos más largos.

  1. Solicitud inicial: Envías el texto con la configuración de voz elegida para iniciar el proceso de conversión.
  2. Solicitud de seguimiento: Después de esperar al menos un minuto, realizas otra solicitud para recuperar el archivo de audio terminado. Este retraso asegura que el sistema tenga tiempo suficiente para procesar el texto más largo sin problemas.

La principal diferencia con el primer método es la necesidad de una segunda solicitud debido al mayor tiempo de procesamiento. Este método asegura un manejo eficiente de textos extensos, haciéndolo adecuado para crear contenido de audio más largo.

Luego subiremos el archivo a Dropbox como demostración, pero las opciones son infinitas sobre cómo puedes usar esta API de TTS.

Puedes descargar e importar el archivo json del plano de demostración para textos largos que se muestra en este blog y usarlo.

1. Requisitos

2. Obtén tu clave API de SpeechGen

  1. Inicia sesión en tu perfil de SpeechGen.io
  2. Navega a tu perfil
  3. Revela y copia tu clave API. La usaremos más tarde.

Clave API de Speechgen

3. Crea un nuevo escenario

Inicia sesión en Make.com y haz clic en "Crear un nuevo escenario".

Crear un nuevo escenario

4. Añade un nuevo módulo

Añadir un nuevo módulo

5. Selecciona HTTP

Busca "HTTP" y selecciona "HTTP" de la lista de módulos disponibles.

Seleccionar HTTP de la lista

6. Seleccionar "Realizar una solicitud"

Seleccionar Realizar una solicitud

7. Introducir URL

Introduzca la URL como https://speechgen.io/index.php?r=api/longtext

Luego, haga clic en "Añadir parámetro" para añadir parámetros de consulta a nuestra solicitud.

Introducir URL

8. Introducir 4 parámetros 

Necesitamos introducir 4 parámetros en total, así que añadamos 3 más.

Añadir 3 parámetros más

9. Introducir los parámetros requeridos

Introducir los parámetros requeridos

  • token = El token de API que copió del Paso 2.
  • email = El correo electrónico asociado a su cuenta de SpeechGen del Paso 2.
  • voice = El nombre exacto de la voz. Puede elegir la voz que desee de la lista completa de voces y copiar el nombre de la voz desde allí. Voces de la API JSON https://speechgen.io/index.php?r=api/voices.
  • text = El texto que desea convertir en voz.

10. Haga clic en Aceptar para guardar los cambios

11. Ejecutar

Ahora es el momento de ejecutar y probar su escenario.

Ejecutar su escenario

12. Haga clic en la burbuja

Haga clic en esta burbuja para ver el resultado de su solicitud.

Haga clic en la burbuja

Concéntrese en la parte de salida, verá "Datos".

Puede ver "id", que es el ID de nuestra solicitud.

ID del archivo

Ahora, para que los datos de SpeechGen sean fácilmente accesibles por otros módulos, podemos añadir otro módulo a nuestro escenario.

13. Añadir otro módulo

Pase el ratón junto al primer módulo que tenemos, verá un botón con un signo más, haga clic en él.

siguiente módulo

14. Añadir JSON

Busque "JSON" y seleccione esta opción.

Seleccionar JSON

Luego, seleccione Analizar JSON para poder exportar los datos de SpeechGen a múltiples variables que podemos usar en nuestro escenario.

Seleccionar Analizar JSON

15. Introducir "Datos"

Haga clic aquí para introducir "Datos" del módulo HTTP anterior.

Introducir Datos

16. Haga clic en "Datos"

Haga clic en "Datos" para añadirlo al campo y haga clic en Aceptar para guardar los cambios.

Haga clic en Datos

17. Ejecutar una vez

Haga clic en Ejecutar una vez para ejecutar el escenario.

Haga clic en Ejecutar una vez para ejecutar el escenario

Seleccione "Ejecutar de todos modos" para forzar a Make a ejecutar el escenario.

Ejecutar de todos modos

Esto se debe a que JSON no debería ser el último módulo en el escenario, ya que transforma los datos de otro módulo y no estamos haciendo nada con esos datos. En este caso, solo queremos ver los datos primero y luego decidir qué hacer con ellos.

18. Haga clic en la burbuja

Haga clic en la burbuja encima del módulo JSON para ver los datos que obtuvimos.

Haga clic en la burbuja encima del módulo JSON

Ahora, los datos que estaban todos bajo "Datos" están en variables individuales que podemos usar en los siguientes módulos.

También puede notar la variable "ID" que usaremos en los siguientes pasos para obtener la URL de nuestro archivo TTS.

URL del archivo TTS

19. Añadir un módulo SLEEP

Añada un módulo SLEEP para esperar a que se genere el TTS.

Dormir

Haga clic en SLEEP

20. Configurar el SLEEP

Configure la duración del SLEEP entre 1 y 5 minutos (60-300 segundos).

Vamos a configurarlo en 200 segundos para nuestra demostración.

Configurar la duración del SLEEP

Ahora, vamos a subir el archivo Mp3 generado a Dropbox. Para ello, primero necesitamos descargar el archivo Mp3 en este escenario.

21. Añadir otro módulo HTTP

Añada otro módulo HTTP para obtener el TTS generado.

Obtener el TTS generado

Inserte los parámetros necesarios:

  • token = El token de API que copió del Paso 2.
  • email = El correo electrónico asociado a su cuenta de SpeechGen del Paso 2.
  • id = El ID del TTS de la primera solicitud [Analizar JSON, paso 2].

22. Mapeo del ID del módulo JSON

Mapeo del ID del módulo JSON

23. Obtener los datos 

Ejecute el escenario para obtener los datos y añada otro módulo Analizar JSON.

Módulo Analizar JSON

Mapee "Datos" del módulo HTTP anterior.

23. Ejecute el escenario una vez más

Ejecute el escenario una vez más para obtener datos del último módulo Analizar JSON, luego añada otro módulo HTTP para descargar el archivo.

Añadir otro módulo HTTP

24. Seleccione "Obtener archivo"

Seleccione "Obtener archivo" para poder descargar el archivo Mp3 dentro del escenario.

Seleccionar Obtener archivo

La mayoría de los módulos solo requieren la URL, pero Dropbox requiere la entrada directa de los datos reales del archivo.

25. Mapee la variable "archivo"

Mapee la variable "archivo", que es la URL que podemos usar para obtener el archivo.

Mapear la variable archivo

26. Luego, añadiremos el módulo de Dropbox

Módulo de Dropbox

27. Seleccionar "Subir archivo"

Seleccionar Subir archivo

Elija la carpeta donde guardar dentro de su Dropbox, luego elija "Mapear" para poder cambiar el nombre del archivo Mp3 subido.

Archivo

Asegúrese de añadir la extensión de archivo ".mp3" al final del nombre, para que sea más fácil para Dropbox reconocerlo como un archivo Mp3 que pueda reproducir.

Archivo Mp3

Después de ejecutar el escenario, tenemos el archivo subido a Dropbox.

El archivo subido a Dropbox

Proceso completo para un método de 2 pasos

Esquema del proceso

  1. HTTP: Generar el audio a partir de texto usando SpeechGen.io.
  2. JSON: Analizar los datos que obtenemos de la API de SpeechGen.
  3. SLEEP: Esperar unos minutos hasta que el TTS esté listo.
  4. HTTP: Solicitar el archivo mp3 usando su ID.
  5. JSON: Analizar los datos como lo hicimos antes.
  6. HTTP: Obtener datos binarios del archivo generado.
  7. Dropbox: Subir esos datos a Dropbox.

Conclusión

La integración de SpeechGen.io con Make.com abre vastas posibilidades para automatizar la creación de contenido de voz. La automatización de la síntesis de voz puede ser útil para:

  • Crear versiones de audio de artículos o blogs.
  • Generar notificaciones de voz para clientes.
  • Producir materiales educativos y de capacitación en formato de audio.
  • Mejorar el servicio al cliente con respuestas de voz.

Ya sea que esté trabajando con notificaciones cortas o materiales educativos extensos, nuestra guía le ayudará a configurar un proceso eficiente con un esfuerzo mínimo. Transforme su texto en voz viva automáticamente, haciendo que su contenido sea más accesible y atractivo para una amplia audiencia.

Utilizamos cookies para garantizar que obtenga la mejor experiencia en nuestro sitio web. Más información: Política de privacidad

Accept Aceptar cookies