Adicione pausas precisas ao seu TTS

, 30-04-2026

Três formas de adicionar pausas precisas ao seu TTS — o ícone de pausa em um clique, a tag SSML <break> e o Controle de Pausa global em Configurações — além de como o Smart Cache deixa as edições de pausa de graça.

Por que as pausas importam · Sem pausas, as frases se atropelam e o resultado fica robótico. Com elas, quem ouve respira junto com a voz, as frases-chave ganham peso e a sua locução soa natural. O SpeechGen oferece quatro caminhos, do mais rápido (um clique) ao mais preciso (quebras em milissegundos), todos funcionando em conjunto. E como o Smart Cache reaproveita os trechos de áudio que não mudaram, ajustar a duração das pausas custa zero limites extras.
0:00 / 0:00
Passo a passo completo: digite 3 frases, insira pausas de três formas, gere o áudio, depois mude uma quebra e veja o Smart Cache devolver zero limites.
01

Comece com três frases curtas

Digite seu texto no editor. Com as pausas padrão, as frases fluem umas nas outras — ótimo na maioria dos casos, mas às vezes você quer um respiro mais longo num momento-chave.

02

O ícone de pausa: um clique, quebra suave

Posicione o cursor onde você quer a pausa e clique no ícone de pausa na barra de ferramentas. Ele insere um marcador pequeno — -. — bem no cursor. O motor TTS lê isso como uma pausa breve e natural. Funciona com toda voz, incluindo as que não têm suporte total a SSML.

Ícone de pausa destacado na barra de ferramentas do editor com o marcador inserido entre frases

O ícone de pausa é a forma mais rápida de adicionar fôlego, sem precisar saber SSML.

03

Digite uma tag <break> para controle preciso

Para tempo exato, digite a tag SSML break você mesmo: <break time="1s"/> para um segundo, <break time="500ms"/> para meio segundo. Use segundos (s) ou milissegundos (ms), o que você preferir.

Tag break manual digitada no editor entre duas frases
04

Ou abra SSML para um seletor visual

Clique em ① SSML na barra de ferramentas para abrir o painel SSML, depois em ② Break para lançar o seletor visual. Sem precisar lembrar da sintaxe da tag: escolha uma predefinição ou digite um valor num campo numérico.

Botão SSML e botão Break destacados na barra de ferramentas do editor
05

Predefinições rápidas: 200ms a 5 segundos

O modal Break abre com oito predefinições de pausa rápida: 200ms · 300ms · 500ms · 700ms · 1000ms · 1500ms · 2000ms · 5000ms. Um clique em qualquer predefinição insere a tag break correspondente no cursor e fecha o modal.

Modal Break com a seção Pausas Rápidas visível
06

Entrada manual: qualquer valor que você precisar

Precisa de uma duração personalizada? Use a seção Manual: informe ① um valor em segundos (0–30) ou milissegundos (50–1000), depois ② clique em Inserir. A tag aparece com o seu tempo exato, por exemplo <break time="750ms"/>.

Campo de ms manual preenchido com 750 e botão Inserir destacado

Segundos para pausas longas (1s, 2s, 5s). Milissegundos para controle fino (250ms, 600ms, 850ms).

07

Controle de Pausa global: para parágrafos e frases

Abra Configurações abaixo do editor. A coluna do meio — Controle de Pausa — tem dois menus suspensos: ① Pausa entre parágrafos (padrão 400ms) controla o silêncio entre blocos de texto separados por linha em branco; ② Pausa entre frases (padrão 300ms) controla o intervalo após cada pontuação final de frase.

Coluna Controle de Pausa no painel Configurações com os menus de pausa de parágrafo e frase destacados

Faixa: de 150ms até 30 segundos. Use valores maiores para podcasts, audiolivros ou conteúdo contemplativo, e valores menores para anúncios e notícias de ritmo rápido.

08

Converter em Voz

Clique em Converter em Voz. O SpeechGen gera seu texto com todas as pausas que você definiu: marcador da barra de ferramentas, tag break manual e Controle de Pausa global, tudo combinado. Ouça o resultado no player abaixo.

Botão Converter em Voz destacado no editor
09

Smart Cache: edições de pausa custam zero

Agora mude a duração de uma quebra — por exemplo, <break time="1s"/><break time="3s"/> — e clique em Converter de novo. Observe o painel de resultado: aparece ① Smart Cache 100% com ② 0 Limites cobrados.

Indicador Smart Cache 100% e mensagem 0 Limites destacados no segundo resultado

O SpeechGen sintetiza o texto frase a frase; cada trecho gerado vai para o cache. Quando você muda só a duração das pausas ou adiciona/edita tags break, os trechos de áudio em si não mudam — vêm do cache, sem custo. Você pode iterar no ritmo o quanto quiser.

O resultado

Ouça o áudio sintetizado com os três métodos de pausa aplicados:

Três frases com pausas · Amber

~10 seg · ícone de pausa + tag break
Abrir este exemplo no editor

Quando usar cada método

Cada método de pausa tem um propósito diferente. Use-os em conjunto para uma fala que soa natural.

Ícone de pausa da barra de ferramentas ( -.)

  • O mais rápido: um clique, sem conhecimento de SSML
  • Funciona com toda voz, inclusive as que não têm suporte a SSML
  • Pausa suave e natural, sem precisar pensar no tempo
  • Ideal para: rascunhos, fala informal, vozes que não aceitam tags SSML

Manual <break time="..."/>

  • Tempo exato: milissegundos ou segundos
  • Digite uma vez, copie e cole em qualquer lugar
  • Visível no seu texto: fácil de revisar e editar depois
  • Ideal para: roteiros, audiolivros, quando você já sabe o tempo exato que quer

Modal Break SSML

  • Seletor visual com predefinições rápidas e entrada manual
  • Sem precisar lembrar a sintaxe da tag
  • Útil para experimentar durações diferentes
  • Ideal para: descobrir o que funciona, testar vários valores rapidamente

Controle de Pausa global (Configurações)

  • Define o tempo de pausa padrão para cada parágrafo e cada frase do seu texto
  • Um único ajuste afeta o documento inteiro
  • Funciona junto com as tags break inline (suas quebras manuais sobrescrevem o ajuste global)
  • Ideal para: conteúdo longo (audiolivros, podcasts) em que você quer ritmo consistente

Quando usar

Em qualquer cenário onde o ritmo natural importa mais do que a pura velocidade do texto-para-voz:

Audiolivros e podcasts

  • Transições de capítulo com pausas mais longas (1,5–3 segundos)
  • Cenas de diálogo: pausas antes de falas dramáticas
  • Trechos reflexivos: pausas de parágrafo mais lentas para criar atmosfera

Educação e treinamento

  • Pausas para compreensão após conceitos-chave (para o aluno absorver)
  • Tempo de quiz: silêncio após cada pergunta para pensar
  • Exercícios de idioma: pausas exatas em segundos para repetir depois

Locuções e anúncios

  • Respiros antes de chamadas para ação importantes
  • Tempo de remate: pequenas pausas para humor
  • Leitura de marca: espaçamento limpo em torno de nomes de marca

URA e sistemas de telefonia

  • Pausas entre opções de menu (para o usuário ter tempo de apertar)
  • Tempo de espera durante prompts de entrada de dados
  • Pausas de confirmação depois de números falados
Feito com SpeechGen.io · Agora você conhece quatro formas de controlar pausas no seu TTS, mais como o Smart Cache deixa a iteração das pausas de graça. Combine com a tag Corte de Áudio para dividir renderizações longas em arquivos separados, ou com o painel SSML para prosódia, ênfase e controle de fonemas.

Observação: um pequeno painel de administração pode aparecer em algumas capturas de tela — é uma ferramenta interna visível apenas à equipe. Você não verá isso na sua conta.

Usamos cookies para garantir que você tenha a melhor experiência em nosso site. Saiba mais: Política

Aceitar Cookies