Afegeix pauses precises al teu TTS

, 30-04-2026

Tres maneres d'afegir pauses precises al teu TTS: una icona de pausa d'un sol clic, l'etiqueta SSML <break> i el Pause Control global a Configuració, més com Smart Cache fa que editar pauses sigui gratuït.

Per què importen les pauses · Sense pauses, les frases es barregen entre si i el resultat sona robòtic. Amb pauses, els oients respiren amb la veu, les frases clau arriben i la teva narració sona natural. SpeechGen ofereix quatre camins, del més ràpid (un clic) al més precís (salts en mil·lisegons), tots compatibles entre si. I com que Smart Cache reutilitza els fragments d'àudio que no han canviat, iterar sobre la durada de les pauses costa zero límits addicionals.
0:00 / 0:00
Guia completa: escriu 3 frases, insereix pauses de tres maneres, renderitza i després canvia un salt per veure com Smart Cache retorna zero límits.
01

Comença amb tres frases curtes

Escriu el text a l'editor. Amb les pauses per defecte, les frases flueixen una rere l'altra: prou per a la majoria de casos, però de vegades vols un alè més llarg en un moment clau.

02

La icona de pausa: un clic, salt suau

Posa el cursor en un punt de pausa i fes clic a la icona de pausa de la barra d'eines. Deixa una marca petita — -.— just al cursor. El motor TTS la llegeix com una pausa breu i natural. Funciona amb totes les veus, fins i tot les que no admeten SSML complet.

Icona de pausa destacada a la barra d'eines de l'editor amb la marca inserida entre frases

La icona de pausa és la manera més ràpida d'afegir un alè: no cal conèixer SSML.

03

Escriu una etiqueta <break> per a un control precís

Per a un temps exacte, escriu tu mateix l'etiqueta SSML break: <break time="1s"/> per a un segon, <break time="500ms"/> per a mig segon. Fes servir segons (s) o mil·lisegons (ms): el que prefereixis.

Etiqueta break manual escrita a l'editor entre dues frases
04

O obre SSML per a un selector visual

Fes clic a ① SSML a la barra d'eines per obrir el panell SSML, després a ② Break per llançar el selector visual. No cal recordar la sintaxi de l'etiqueta: tria un predefinit o escriu un valor en un camp numèric.

Botons SSML i Break destacats a la barra d'eines de l'editor
05

Predefinits ràpids: de 200ms a 5 segons

El modal Break s'obre amb vuit predefinits de pausa ràpida: 200ms · 300ms · 500ms · 700ms · 1000ms · 1500ms · 2000ms · 5000ms. Un clic a qualsevol predefinit insereix l'etiqueta break corresponent al cursor i tanca el modal.

Modal Break amb la secció Pauses ràpides visible
06

Entrada manual: qualsevol valor que necessitis

Necessites una durada personalitzada? Fes servir la secció Manual: introdueix ① un valor en segons (0–30) o mil·lisegons (50–1000), després fes clic a ② Insereix. L'etiqueta entra amb el teu temps exacte, per exemple <break time="750ms"/>.

Camp ms manual omplert amb 750 i botó Insereix destacat

Segons per a pauses llargues (1s, 2s, 5s). Mil·lisegons per a un control fi (250ms, 600ms, 850ms).

07

Pause Control global: per a paràgrafs i frases

Obre Configuració sota l'editor. La columna del mig —Pause Control— té dos desplegables: ① Pausa entre paràgrafs (per defecte 400ms) controla el silenci entre blocs de text separats per una línia en blanc; ② Pausa entre frases (per defecte 300ms) controla el buit després de cada signe de puntuació final.

Columna Pause Control al panell de Configuració amb els desplegables de pausa de paràgraf i frase destacats

Rang: de 150ms fins a 30 segons. Fes servir valors més llargs per a podcasts, audiollibres o contingut contemplatiu, i valors més curts per a anuncis ràpids o notícies.

08

Converteix en veu

Fes clic a Converteix en veu. SpeechGen renderitza el text amb totes les pauses que has fixat: marca de la barra d'eines, etiqueta break manual i configuració global de Pause Control, tot combinat. Escolta el resultat al reproductor de sota.

Botó Converteix en veu destacat a l'editor
09

Smart Cache: editar pauses costa zero

Ara canvia la durada d'un salt, per exemple <break time="1s"/><break time="3s"/>, i fes clic a Converteix de nou. Mira el panell de resultats: apareix ① Smart Cache 100% amb ② 0 límits cobrats.

Indicador Smart Cache 100% i missatge 0 límits destacats al segon resultat

SpeechGen sintetitza el text frase a frase; cada fragment generat es desa a la memòria cau. Quan només canvies durades de pausa o afegeixes/edites etiquetes break, els fragments d'àudio reals no han canviat: se serveixen des de la cau a cost zero. Pots iterar sobre el ritme tantes vegades com vulguis.

El resultat

Escolta l'àudio sintetitzat amb els tres mètodes de pausa aplicats:

Tres frases amb pauses · Amber

~10 seg · icona de pausa + etiqueta break
Obre aquest exemple a l'editor

Quan fer servir cada mètode

Cada mètode de pausa serveix per a un propòsit diferent. Combina'ls per aconseguir una veu natural.

Icona de pausa de la barra d'eines ( -.)

  • El més ràpid: un clic, sense saber SSML
  • Funciona amb totes les veus, incloses les que no admeten SSML
  • Pausa suau i natural: no cal pensar en el temps
  • Ideal per a: esborranys, parla informal, veus que no accepten etiquetes SSML

Manual <break time="..."/>

  • Temps exacte: mil·lisegons o segons
  • Escriu-la una vegada i copia-enganxa-la on vulguis
  • Visible al teu text: fàcil de revisar i editar després
  • Ideal per a: contingut amb guió, audiollibres, quan saps el ritme exacte que vols

Modal SSML Break

  • Selector visual amb predefinits ràpids i una entrada manual
  • No cal recordar la sintaxi de l'etiqueta
  • Útil quan experimentes amb durades diferents
  • Ideal per a: descobrir què funciona, provar diversos valors ràpidament

Pause Control global (Configuració)

  • Fixa la durada de pausa per defecte per a cada paràgraf i cada frase del text
  • Un sol comandament: afecta tot el document
  • Funciona al costat de les etiquetes break inline (els teus salts manuals tenen prioritat sobre la configuració global)
  • Ideal per a: contingut llarg (audiollibres, podcasts) on vols un ritme consistent

Quan fer-ho servir

A qualsevol lloc on el ritme natural importi més que la velocitat bruta de text a veu:

Audiollibres i podcasts

  • Transicions de capítol amb salts més llargs (1,5–3 segons)
  • Escenes de diàleg: pauses abans de frases dramàtiques
  • Passatges reflexius: pauses de paràgraf més lentes per a l'atmosfera

Educació i formació

  • Pauses de comprensió després de conceptes clau (perquè els oients assimilin)
  • Ritme de qüestionari: silenci després de cada pregunta per pensar
  • Exercicis d'idiomes: pauses d'un segon exacte per practicar la repetició

Veus en off i anuncis

  • Compassos abans de les crides a l'acció clau
  • Ritme del remat: petits salts per a la comèdia
  • Lectures de marca: espaiat net al voltant dels noms de marca

IVR i sistemes telefònics

  • Pauses entre opcions de menú (perquè els oients puguin prémer)
  • Compassos d'espera durant les indicacions d'introducció de dades
  • Pauses de confirmació després de números parlats
Fet amb SpeechGen.io · Ara coneixes quatre maneres de controlar les pauses al teu TTS, més com Smart Cache fa que la iteració de pauses sigui gratuïta. Combina'l amb l'etiqueta Audio Cut per dividir renderitzacions llargues en fitxers separats, o amb el panell SSML per a la prosòdia, l'èmfasi i el control de fonemes.

Nota: pot aparèixer un petit panell d'administració en algunes captures: és una eina interna només visible per al personal. No la veuràs al teu compte.

Utilitzem cookies per a assegurar-nos que obtinguis la millor experiència en el nostre lloc web. Més informació: Política de privacitat

Acceptar Cookies