Sintetize Voz a Partir de Texto Sem Custos Adicionais Graças à Exclusiva Tecnologia de Cache Inteligente

, 22-09-2025

A Speechgen oferece uma funcionalidade única e económica de cache que reduz significativamente o tempo e os custos de conversão de texto em voz. Neste artigo, vamos explorar como esta funcionalidade funciona, os seus benefícios e como ajuda a poupar em narrações.

Como Funciona o Cache Económico

Quando sintetiza voz, a Speechgen memoriza o resultado de cada frase. Por exemplo:

  • Narrou 30 frases.
  • Depois adicionou mais 10 e narrou-as novamente.
  • A Speechgen irá buscar as 30 frases já narradas da memória, narrar as 10 novas e combiná-las numa só ficheiro.

Benefícios:

  • Menos tempo para narração
  • Poupança nos limites para frases já narradas

Exemplo de Utilização

Imagine que está a trabalhar na narração de um curso educativo com 20 lições. Após terminar o trabalho, decide adicionar uma breve introdução a cada lição. Com um serviço normal, teria de narrar todo o material novamente, o que levaria a custos significativos. Com a Speechgen, pagará apenas pela narração das novas introduções, poupando recursos e tempo.

Aqui fica uma comparação da Speechgen com outros serviços:

Exemplo

Outros TTS

Speechgen

Exemplo #1: 30 frases

100% custo

100% custo

Exemplo #2: 30 frases + 10 novas

100% custo

25% custo

Com outros serviços de síntese de voz, cada narração incorre num custo de 100% de tudo o que narrou. Com a Speechgen, apenas as frases novas ou alteradas são narradas. Como se vê na tabela, com uma narração repetida, a Speechgen utilizou apenas 25% da contagem total de caracteres em vez de 100%, uma vez que 75% do texto foi retirado de conteúdo previamente narrado.

Isto significa que não precisa de se preocupar com custos repetidos ao rever o seu texto. Pode voltar ao seu texto mais tarde e trabalhar com ele.

Termos e Limitações

  • Volume de Texto: Até 100.000 caracteres para as mesmas definições e locutor.
  • Duração de Armazenamento: O cache económico é armazenado por 1 semana.
  • Unidade de Cache: São guardadas frases inteiras, não palavras individuais.

Operação Detalhada

Texto até 100.000 caracteres

Acima disso, é utilizado um modo de livro para uma narração mais rápida de textos longos, processando por grandes blocos de texto em vez de frases. A Speechgen pode narrar até 2.000.000 de caracteres de uma vez, mas o cache económico funciona até 100.000 caracteres.

Cache Económico Armazenado por 1 Semana

As frases narradas são armazenadas na memória apenas por 1 semana. Tem 7 dias para complementar ou rever a narração.

Adicionalmente, no seu perfil, o histórico completo da narração é armazenado por 30 dias. Isto significa que dentro de 30 dias pode descarregar o texto e o ficheiro na sua totalidade. No entanto, o cache em si será armazenado apenas por 7 dias.

Se decidir, por exemplo, adicionar à narração após 25 dias, os limites serão deduzidos novamente para todo o projeto. Ao guardar a narração nos favoritos, pode manter o áudio com o texto para sempre, mas o cache ainda assim será armazenado apenas por 7 dias.

O seu texto e ficheiro de áudio são guardados no seu perfil, mas não o cache, por isso tenha isto em mente ao trabalhar.

O que Constitui uma Alteração de Texto

O cache funciona apenas para frases inalteradas. Se alterar uma única letra ou remover uma vírgula numa frase, ela é considerada nova pelo sistema.

Exemplos

Adicionar uma Nova Frase:

Texto Original:

  • A inteligência artificial está a mudar o mundo.
  • A tecnologia avança a uma velocidade incrível.
  • O futuro, que esperávamos, chegou.

Adicionar uma nova frase:

  • Devemos estar preparados para as mudanças.

Resultado: A Speechgen pega nas três primeiras frases do cache e narra apenas a quarta. Os custos são incorridos apenas pela quarta frase.

Alterar uma Palavra:

Texto Original:

  • A inteligência artificial está a mudar o mundo.
  • A tecnologia avança a uma velocidade incrível.
  • O futuro, que esperávamos, chegou.

Alterar uma palavra na segunda frase:

  • A tecnologia avança a uma velocidade surpreendente.

Resultado: A Speechgen pega na primeira e terceira frases do cache, mas narra a segunda novamente.

Remover uma Vírgula:

Texto Original:

  • A inteligência artificial está a mudar o mundo.
  • A tecnologia avança a uma velocidade incrível.
  • O futuro, que esperávamos, chegou.

Remover as vírgulas na terceira frase:

  • O futuro que esperávamos chegou.

Resultado: A Speechgen irá re-narrar a terceira frase e pegar nas primeira e segunda frases do cache. A terceira frase é considerada alterada devido à remoção das vírgulas.

Alterações Adicionais

Adicionar <break>

Se adicionar uma nova etiqueta de pausa, como break, também é considerada uma alteração na frase. O sistema irá reanalisá-la e re-narrá-la.

<break time="200ms"/>

Na verdade, as frases são recuperadas do cache económico com base numa correspondência completa, caractere a caractere. Se houver algum caractere novo ou se um caractere estiver em falta na frase, o programa não conseguirá corresponder exatamente.

Alterar Velocidade, Tom e Locutor

Se alterar as definições de velocidade ou tom, será uma narração completamente nova, e o cache económico não funcionará. Ao alterar a velocidade ou o tom, a rede neural re-narra o texto com estes novos parâmetros. Isto não é uma aceleração ou alteração de tom por software; é uma re-narração completa.

Alterar o locutor também resulta numa re-narração completa. Aqui, a rede neural faz todo o trabalho novamente. Portanto, se estiver a ajustar a voz, faça-o para 1-2 frases e, assim que estiver satisfeito com a velocidade e o tom, narre todo o texto desejado.

O Que Pode Ser Alterado

Acelerar e Desacelerar a Voz em Legendas

Nesta página especial https://speechgen.io/pt/subs/, pode narrar legendas. Para ajustar o tempo, é muitas vezes necessário acelerar a fala para cumprir o tempo exigido. Neste caso, o cache económico funciona, pois a Speechgen primeiro narra e depois acelera programaticamente a legenda.

Alterar Pausas nas Definições

Pode alterar as pausas nas definições sob o campo de narração, e o cache funcionará perfeitamente. Guardamos frases inteiras na memória, e o sistema combina-as em áudio. Desta forma, pode ajustar pausas entre frases ou parágrafos sem custos adicionais.

Alterar Formato

Se selecionar um formato diferente — ogg, wav, opus — e clicar em re-narração, o sistema não lhe cobrará quaisquer limites. Isto é gratuito. Se narrou e depois percebeu que precisava de um formato diferente, altere-o sem receio de custos duplicados.

Alterar Taxa de Amostragem

Se alterar a Taxa de Amostragem nas definições e clicar novamente em re-narração, o sistema não lhe cobrará quaisquer limites. Isto é gratuito.

Conclusão

O sistema de cache económico da Speechgen oferece vantagens significativas:

  • Poupança de Recursos: Pague apenas pelo conteúdo novo, não pelo texto inteiro novamente.
  • Trabalho Mais Rápido: Narrações repetidas são muito mais rápidas.
  • Flexibilidade: Experimente com o seu texto sem se preocupar com custos adicionais.

A Speechgen poupa os seus recursos e fornece ferramentas para um trabalho mais eficiente com conteúdo áudio, tornando-a uma escolha ideal para quem valoriza a eficiência e a qualidade na síntese de voz.

Usamos cookies para garantir que você tenha a melhor experiência em nosso site. Saiba mais: Política

Aceitar Cookies