22-09-2025 , 22-09-2025
A Speechgen oferece uma funcionalidade única e económica de cache que reduz significativamente o tempo e os custos de conversão de texto em voz. Neste artigo, vamos explorar como esta funcionalidade funciona, os seus benefícios e como ajuda a poupar em narrações.
Quando sintetiza voz, a Speechgen memoriza o resultado de cada frase. Por exemplo:
Imagine que está a trabalhar na narração de um curso educativo com 20 lições. Após terminar o trabalho, decide adicionar uma breve introdução a cada lição. Com um serviço normal, teria de narrar todo o material novamente, o que levaria a custos significativos. Com a Speechgen, pagará apenas pela narração das novas introduções, poupando recursos e tempo.
Aqui fica uma comparação da Speechgen com outros serviços:
Exemplo |
Outros TTS |
Speechgen |
Exemplo #1: 30 frases |
100% custo |
100% custo |
Exemplo #2: 30 frases + 10 novas |
100% custo |
25% custo |
Com outros serviços de síntese de voz, cada narração incorre num custo de 100% de tudo o que narrou. Com a Speechgen, apenas as frases novas ou alteradas são narradas. Como se vê na tabela, com uma narração repetida, a Speechgen utilizou apenas 25% da contagem total de caracteres em vez de 100%, uma vez que 75% do texto foi retirado de conteúdo previamente narrado.
Isto significa que não precisa de se preocupar com custos repetidos ao rever o seu texto. Pode voltar ao seu texto mais tarde e trabalhar com ele.
Acima disso, é utilizado um modo de livro para uma narração mais rápida de textos longos, processando por grandes blocos de texto em vez de frases. A Speechgen pode narrar até 2.000.000 de caracteres de uma vez, mas o cache económico funciona até 100.000 caracteres.
As frases narradas são armazenadas na memória apenas por 1 semana. Tem 7 dias para complementar ou rever a narração.
Adicionalmente, no seu perfil, o histórico completo da narração é armazenado por 30 dias. Isto significa que dentro de 30 dias pode descarregar o texto e o ficheiro na sua totalidade. No entanto, o cache em si será armazenado apenas por 7 dias.
Se decidir, por exemplo, adicionar à narração após 25 dias, os limites serão deduzidos novamente para todo o projeto. Ao guardar a narração nos favoritos, pode manter o áudio com o texto para sempre, mas o cache ainda assim será armazenado apenas por 7 dias.
O seu texto e ficheiro de áudio são guardados no seu perfil, mas não o cache, por isso tenha isto em mente ao trabalhar.
O cache funciona apenas para frases inalteradas. Se alterar uma única letra ou remover uma vírgula numa frase, ela é considerada nova pelo sistema.
Texto Original:
Adicionar uma nova frase:
Resultado: A Speechgen pega nas três primeiras frases do cache e narra apenas a quarta. Os custos são incorridos apenas pela quarta frase.
Texto Original:
Alterar uma palavra na segunda frase:
Resultado: A Speechgen pega na primeira e terceira frases do cache, mas narra a segunda novamente.
Texto Original:
Remover as vírgulas na terceira frase:
Resultado: A Speechgen irá re-narrar a terceira frase e pegar nas primeira e segunda frases do cache. A terceira frase é considerada alterada devido à remoção das vírgulas.
Se adicionar uma nova etiqueta de pausa, como break, também é considerada uma alteração na frase. O sistema irá reanalisá-la e re-narrá-la.
<break time="200ms"/>
Na verdade, as frases são recuperadas do cache económico com base numa correspondência completa, caractere a caractere. Se houver algum caractere novo ou se um caractere estiver em falta na frase, o programa não conseguirá corresponder exatamente.
Se alterar as definições de velocidade ou tom, será uma narração completamente nova, e o cache económico não funcionará. Ao alterar a velocidade ou o tom, a rede neural re-narra o texto com estes novos parâmetros. Isto não é uma aceleração ou alteração de tom por software; é uma re-narração completa.
Alterar o locutor também resulta numa re-narração completa. Aqui, a rede neural faz todo o trabalho novamente. Portanto, se estiver a ajustar a voz, faça-o para 1-2 frases e, assim que estiver satisfeito com a velocidade e o tom, narre todo o texto desejado.
Nesta página especial https://speechgen.io/pt/subs/, pode narrar legendas. Para ajustar o tempo, é muitas vezes necessário acelerar a fala para cumprir o tempo exigido. Neste caso, o cache económico funciona, pois a Speechgen primeiro narra e depois acelera programaticamente a legenda.
Pode alterar as pausas nas definições sob o campo de narração, e o cache funcionará perfeitamente. Guardamos frases inteiras na memória, e o sistema combina-as em áudio. Desta forma, pode ajustar pausas entre frases ou parágrafos sem custos adicionais.
Se selecionar um formato diferente — ogg, wav, opus — e clicar em re-narração, o sistema não lhe cobrará quaisquer limites. Isto é gratuito. Se narrou e depois percebeu que precisava de um formato diferente, altere-o sem receio de custos duplicados.
Se alterar a Taxa de Amostragem nas definições e clicar novamente em re-narração, o sistema não lhe cobrará quaisquer limites. Isto é gratuito.
O sistema de cache económico da Speechgen oferece vantagens significativas:
A Speechgen poupa os seus recursos e fornece ferramentas para um trabalho mais eficiente com conteúdo áudio, tornando-a uma escolha ideal para quem valoriza a eficiência e a qualidade na síntese de voz.