Integración de la API de SpeechGen con Make.com: Automatiza flujos de trabajo de texto a voz

27-10-2025 , 27-10-2025

Simplifica la creación de contenido de voz: Integrando SpeechGen.io con Make.com. Esta publicación de blog te guía a través de la integración del servicio de automatización Make.com (anteriormente Integromat) con nuestro servicio de síntesis de voz basado en redes neuronales, SpeechGen.io. Esta integración permite la automatización de los procesos de texto a voz, haciendo que la creación de contenido sea más fácil y eficiente.

Cómo funciona

Cubrimos dos métodos basados en la longitud del texto que deseas convertir a voz:

Para textos de hasta 2000 caracteres: Este método implica una solicitud rápida y la recepción inmediata de la salida de voz. Es perfecto para textos cortos que necesitan ser convertidos rápidamente.
Para textos de más de 2000 caracteres: Este método utiliza dos solicitudes. La primera solicitud envía el texto con la configuración de voz para la conversión. La segunda solicitud, que debe hacerse no antes de un minuto después, recupera el archivo de audio terminado. Este enfoque asegura que los textos más largos se procesen de manera eficiente sin sobrecargar el sistema.

¿Por qué usar Make.com?

Make.com facilita la automatización de estos procesos sin necesidad de conocimientos técnicos profundos. Puedes configurar activadores para iniciar automáticamente el proceso de texto a voz cuando se cumplan ciertas condiciones, como la adición de nuevo texto a tu CMS o base de datos.

Primeros pasos

Para comenzar con la integración, deberás familiarizarte con nuestra API. Puedes encontrar toda la información necesaria, incluyendo documentación y preguntas frecuentes, en Preguntas frecuentes de la API de SpeechGen.io.

Guía de video completa

1. Método de texto corto

En esta publicación de blog aprenderemos cómo generar un archivo Mp3 a partir de texto usando SpeechGen, y luego subir ese archivo Mp3 a DropBox.

Puedes descargar e importar el archivo json del proyecto de demostración que se muestra en este blog y usarlo.

1. Requisitos

2. Obtén tu clave API de SpeechGen

Inicia sesión en tu perfil de SpeechGen.io
Navega a tu perfil
Revela y copia tu clave API. La usaremos más tarde.

Clave API de Speechgen

3. Crea un nuevo escenario

Inicia sesión en Make.com y haz clic en "Crear un nuevo escenario".

Crear un nuevo escenario

4. Añade un nuevo módulo

Añadir un nuevo módulo

5. Selecciona HTTP

Busca "HTTP" y selecciona "HTTP" de la lista de módulos disponibles.

Seleccionar HTTP de la lista

6. Selecciona Hacer una solicitud

Seleccionar Hacer una solicitud

7. Introduce la URL

Introduce la URL como https://speechgen.io/index.php?r=api/text

Luego haz clic en "Añadir parámetro" para añadir parámetros de consulta a nuestra solicitud.

Introducir URL

8. Inserta 3 parámetros más

Necesitamos introducir 4 parámetros en total, así que añadamos 3 más.

Añadir 3 parámetros más

9. Introduce los parámetros requeridos

Introducir los parámetros requeridos

token = El token API que copiaste del Paso 2
email = El correo electrónico asociado a tu cuenta de SpeechGen
voice = El nombre exacto de la voz, puedes elegir la voz que te guste de la lista completa de voces y copiar el nombre de la voz desde allí. Voces de la API JSON https://speechgen.io/index.php?r=api/voices.
text = El texto que quieres convertir a voz. Por ejemplo, pegaré el siguiente texto: "Una solución práctica para crear locuciones, materiales de e-learning y publicidad. Genera voz a partir de texto en varios idiomas y acentos. Personaliza la configuración de voz para satisfacer necesidades específicas".

10. Haz clic en OK para guardar los cambios

OK para guardar los cambios

11. Ejecuta tu escenario

Ahora es el momento de ejecutar y probar tu escenario.

Ejecuta tu escenario

12. Haz clic en la burbuja

Haz clic en esta burbuja para ver el resultado de tu solicitud.

Haz clic en la burbuja

Concéntrate en la parte de salida, verás 'Data'.

Puedes ver 'file' que es la URL del archivo Mp3 generado de nuestro texto.

archivo Mp3 generado

Si navegas a esta URL, puedes reproducir y descargar el archivo Mp3.

Para que los datos de SpeechGen sean fácilmente accesibles por otros módulos, podemos añadir otro módulo a nuestro escenario.

14. Añade otro módulo

Pasa el ratón junto al primer módulo que tenemos, verás un botón de más, haz clic en él.

siguiente módulo

15. Selecciona la opción 'JSON'

Busca 'JSON' y selecciona esta opción.

Seleccionar json

16. Elige Analizar JSON

Luego selecciona "Analizar JSON" para que podamos exportar los datos de SpeechGen a múltiples variables que podemos usar en nuestro escenario.

Seleccionar Analizar JSON

17. Introduce 'Data'

Haz clic aquí (cadena JSON) para introducir 'Data' del módulo HTTP anterior.

Introducir Datos

18. Haz clic en 'Data'

Haz clic en 'Data' para añadirlo al campo y haz clic en OK para guardar los cambios.

Haz clic en Datos

19. Ejecutar una vez

Haz clic en 'Ejecutar una vez' para ejecutar el escenario.

Haz clic en Ejecutar una vez para ejecutar el escenario

Selecciona 'Ejecutar de todos modos' para forzar a Make a ejecutar el escenario.

Ejecutar de todos modos

Esto se debe a que JSON no debería ser el último módulo en el escenario, ya que transforma los datos de otro módulo y no estamos haciendo nada con esos datos. En este caso, solo queremos ver los datos primero y luego decidir qué hacer con ellos.

20. Haz clic en la burbuja

Haz clic en la burbuja encima del módulo JSON para ver los datos que obtuvimos.

Haz clic en la burbuja encima del módulo JSON

Ahora los datos que estaban todos bajo 'Data' están en variables individuales que podemos usar en los siguientes módulos...

También puedes notar la variable 'file' que tenía la URL del archivo Mp3 generado que usaremos en el siguiente módulo.

Observa el archivo

Ahora subamos el archivo Mp3 generado a Dropbox. Para ello, primero necesitamos descargar el archivo Mp3 en este escenario.

21. Añade otro módulo HTTP para descargar el archivo

Añade otro módulo HTTP

Selecciona Obtener archivo para que podamos descargar el archivo Mp3 dentro del escenario.

Seleccionar Obtener archivo

La mayoría de los módulos solo requieren la URL, pero Dropbox requiere la entrada directa de los datos reales del archivo.

22. Mapea la variable 'file'

Mapea la variable 'file', que es la URL que podemos usar para obtener el archivo.

Mapea la variable de archivo

23. Módulo de Dropbox

Luego añadiremos el módulo de Dropbox.

Módulo de Dropbox

24. Selecciona Subir archivo

Seleccionar Subir archivo

Elige la carpeta donde guardar dentro de tu Dropbox, luego elige Mapear para que podamos cambiar el nombre del archivo Mp3 subido.

Archivo

Asegúrate de añadir la extensión de archivo '.mp3' al final del nombre, para que sea más fácil para Dropbox reconocerlo como un archivo Mp3 que puedes reproducir.

Archivo Mp3

Después de ejecutar el escenario, tenemos el archivo subido a Dropbox.

El archivo subido a Dropbox

Proceso completo para el primer método

Una vista previa de todo el proceso

HTTP: Genera el audio a partir de texto usando SpeechGen.io
JSON: Analiza los datos que obtenemos de la API de SpeechGen
HTTP: Obtiene los datos binarios del archivo generado
Dropbox: Sube esos datos a Dropbox

2. Método de texto largo

Ahora, estamos utilizando la API de texto largo de SpeechGen para generar un TTS largo.

El segundo método está diseñado para textos de más de 2000 caracteres. A diferencia del primer método, que convierte rápidamente textos cortos a voz, este enfoque implica dos pasos debido al tiempo de procesamiento requerido para textos más largos.

Solicitud inicial: Envías el texto con la configuración de voz elegida para iniciar el proceso de conversión.
Solicitud de seguimiento: Después de esperar al menos un minuto, realizas otra solicitud para recuperar el archivo de audio terminado. Este retraso asegura que el sistema tenga tiempo suficiente para procesar el texto más largo sin problemas.

La principal diferencia con el primer método es la necesidad de una segunda solicitud debido al mayor tiempo de procesamiento. Este método asegura un manejo eficiente de textos extensos, haciéndolo adecuado para crear contenido de audio más largo.

Luego subiremos el archivo a Dropbox como demostración, pero las opciones son infinitas sobre cómo puedes usar esta API de TTS.

Puedes descargar e importar el archivo json del plano de demostración para textos largos que se muestra en este blog y usarlo.