Añade pausas precisas a tu TTS

, 30-04-2026

Tres formas de añadir pausas precisas a tu TTS: un icono de pausa de un clic, la etiqueta SSML <break> y el Control de pausas global en Ajustes. Además, cómo Smart Cache hace que editar pausas sea gratis.

Por qué importan las pausas · Sin pausas, las frases se atropellan unas con otras y el resultado suena robótico. Con ellas, el oyente respira con la voz, las frases clave aterrizan y tu voiceover suena natural. SpeechGen ofrece cuatro rutas, desde la más rápida (un clic) a la más precisa (silencios al milisegundo), todas funcionando juntas. Y como Smart Cache reutiliza los fragmentos de audio que no han cambiado, iterar sobre la duración de las pausas no cuesta ningún límite adicional.
0:00 / 0:00
Recorrido completo: escribe 3 frases, inserta pausas de tres formas distintas, procesa y luego cambia un silencio para ver cómo Smart Cache devuelve cero límites.
01

Empieza con tres frases cortas

Escribe tu texto en el editor. Con las pausas por defecto, las frases se encadenan entre sí, lo cual está bien en la mayoría de casos, pero a veces quieres un respiro más largo en un momento clave.

02

El icono de pausa: un clic, silencio suave

Coloca el cursor en el punto de pausa y haz clic en el icono de pausa de la barra de herramientas. Inserta un pequeño marcador, -., justo en el cursor. El motor TTS lo lee como una pausa breve y natural. Funciona con todas las voces, incluso las que no admiten SSML completo.

Icono de pausa resaltado en la barra de herramientas del editor con el marcador insertado entre frases

El icono de pausa es la forma más rápida de añadir un respiro: no hace falta saber SSML.

03

Escribe una etiqueta <break> para un control preciso

Para un tiempo exacto, escribe tú mismo la etiqueta SSML break: <break time="1s"/> para un segundo, <break time="500ms"/> para medio segundo. Usa segundos (s) o milisegundos (ms): lo que prefieras.

Etiqueta break escrita manualmente en el editor entre dos frases
04

O abre SSML para usar un selector visual

Haz clic en ① SSML en la barra de herramientas para abrir el panel SSML y luego en ② Break para lanzar el selector visual. No hace falta recordar la sintaxis de las etiquetas: elige un preajuste o escribe un valor en un campo numérico.

Botón SSML y botón Break resaltados en la barra de herramientas del editor
05

Preajustes rápidos: de 200ms a 5 segundos

El modal Break se abre con ocho preajustes de pausa rápida: 200ms · 300ms · 500ms · 700ms · 1000ms · 1500ms · 2000ms · 5000ms. Un clic en cualquier preajuste inserta la etiqueta break correspondiente en el cursor y cierra el modal.

Modal Break con la sección Pausas rápidas visible
06

Entrada manual: cualquier valor que necesites

¿Necesitas una duración personalizada? Usa la sección Manual: introduce ① un valor en segundos (0–30) o milisegundos (50–1000) y luego ② haz clic en Insertar. La etiqueta se añade con tu tiempo exacto, por ejemplo <break time="750ms"/>.

Campo manual de ms con 750 introducido y botón Insertar resaltado

Segundos para silencios largos (1s, 2s, 5s). Milisegundos para un control fino (250ms, 600ms, 850ms).

07

Control de pausas global: para párrafos y frases

Abre Ajustes debajo del editor. La columna central, Control de pausas, tiene dos desplegables: ① Pausa entre párrafos (por defecto 400ms) controla el silencio entre bloques de texto separados por una línea en blanco; ② Pausa entre frases (por defecto 300ms) controla el hueco después de cada signo de puntuación que cierra una frase.

Columna Control de pausas en el panel de Ajustes con los desplegables de pausa de párrafo y frase resaltados

Rango: de 150ms hasta 30 segundos. Usa valores más largos para podcasts, audiolibros o contenido reflexivo; valores más cortos para anuncios rápidos o noticias.

08

Convertir a voz

Haz clic en Convertir a voz. SpeechGen procesa tu texto con todas las pausas que has definido: el marcador de la barra de herramientas, la etiqueta break manual y los ajustes globales de Control de pausas, todo combinado. Escucha el resultado en el reproductor de abajo.

Botón Convertir a voz resaltado en el editor
09

Smart Cache: editar pausas cuesta cero

Ahora cambia la duración de un silencio — por ejemplo, <break time="1s"/><break time="3s"/> — y vuelve a hacer clic en Convertir. Observa el panel de resultado: aparece ① Smart Cache 100% con ② 0 límites cobrados.

Indicador Smart Cache 100% y mensaje 0 límites resaltados en el segundo resultado

SpeechGen sintetiza el texto frase a frase; cada fragmento generado se guarda en caché. Cuando solo cambias duraciones de pausas o añades/editas etiquetas break, los fragmentos de audio reales no han cambiado: se sirven desde caché a coste cero. Puedes iterar sobre el ritmo todas las veces que quieras.

El resultado

Escucha el audio sintetizado con los tres métodos de pausa aplicados:

Tres frases con pausas · Amber

~10 s · icono de pausa + etiqueta break
Abrir este ejemplo en el editor

Cuándo usar cada método

Cada método de pausa cumple una función distinta. Combínalos para conseguir un habla con sonido natural.

Icono de pausa de la barra de herramientas ( -.)

  • El más rápido: un clic, sin conocimientos de SSML
  • Funciona con todas las voces, incluso las que no admiten SSML
  • Pausa suave y natural: no hace falta pensar en la duración
  • Ideal para: borradores, habla informal, voces que no aceptan etiquetas SSML

Manual <break time="..."/>

  • Tiempo exacto: milisegundos o segundos
  • Escríbelo una vez y copia-pega donde quieras
  • Visible en tu texto: fácil de revisar y editar después
  • Ideal para: contenido guionizado, audiolibros, cuando sabes el ritmo exacto que quieres

Modal SSML Break

  • Selector visual con preajustes rápidos y entrada manual
  • No hace falta recordar la sintaxis de las etiquetas
  • Útil cuando experimentas con distintas duraciones
  • Ideal para: descubrir qué funciona, probar varios valores rápidamente

Control de pausas global (Ajustes)

  • Define la duración de pausa por defecto para cada párrafo y cada frase de tu texto
  • Un solo control: afecta a todo el documento
  • Funciona junto con las etiquetas break en línea (tus breaks manuales tienen prioridad sobre el ajuste global)
  • Ideal para: contenido largo (audiolibros, podcasts) donde quieres un ritmo consistente

Cuándo usarlo

En cualquier sitio donde el ritmo natural importa más que la velocidad bruta del texto a voz:

Audiolibros y podcasts

  • Transiciones entre capítulos con silencios más largos (1,5–3 segundos)
  • Escenas de diálogo: pausas antes de frases dramáticas
  • Pasajes reflexivos: pausas de párrafo más lentas para la atmósfera

Educación y formación

  • Pausas de comprensión después de conceptos clave (para que el oyente asimile)
  • Tiempos de quiz: silencio tras cada pregunta para pensar
  • Ejercicios de idioma: pausas de segundos exactos para repetir después

Voiceovers y anuncios

  • Silencios antes de las llamadas a la acción clave
  • Tiempo de remate: pequeños silencios para la comedia
  • Lecturas de marca: espacio limpio alrededor de los nombres de marca

IVR y sistemas telefónicos

  • Pausas entre opciones de menú (para que el oyente pueda pulsar)
  • Silencios de espera durante los avisos de introducción de datos
  • Pausas de confirmación tras los números hablados
Hecho con SpeechGen.io · Ahora ya conoces cuatro formas de controlar las pausas en tu TTS, además de cómo Smart Cache hace que iterar sobre las pausas sea gratis. Combínalas con la etiqueta Audio Cut para dividir renders largos en archivos separados, o con el panel SSML para prosodia, énfasis y control de fonemas.

Nota: en algunas capturas puede aparecer un pequeño panel de administración; es una herramienta interna que solo ve el equipo. No la verás en tu cuenta.

Utilizamos cookies para garantizar que obtenga la mejor experiencia en nuestro sitio web. Más información: Política de privacidad

Accept Aceptar cookies