22-09-2025 , 22-09-2025
Speechgen nabízí unikátní úspornou funkci cachování, která výrazně snižuje čas a náklady na převod textu na řeč. V tomto článku prozkoumáme, jak tato funkce funguje, jaké jsou její výhody a jak vám pomůže ušetřit při hlasových nahrávkách.
Když syntetizujete řeč, Speechgen si pamatuje výsledek každé věty. Například:
Představte si, že pracujete na nahrávce pro vzdělávací kurz s 20 lekcemi. Po dokončení práce se rozhodnete přidat ke každé lekci krátký úvod. S běžnou službou byste museli nahrát celý materiál znovu, což by vedlo k značným nákladům. Se Speechgenem zaplatíte pouze za nahrání nových úvodů, čímž ušetříte zdroje a čas.
Zde je srovnání Speechgenu s jinými službami:
Příklad |
Jiný TTS |
Speechgen |
Příklad č. 1: 30 vět |
100% náklady |
100% náklady |
Příklad č. 2: 30 vět + 10 nových |
100% náklady |
25% náklady |
S jinými službami pro syntézu řeči každá hlasová nahrávka představuje 100% nákladů na vše, co jste nahráli. Se Speechgenem se nahrávají pouze nové nebo změněné věty. Jak je vidět v tabulce, při opakované hlasové nahrávce Speechgen použil pouze 25 % celkového počtu znaků namísto 100 %, protože 75 % textu bylo převzato z dříve nahraného obsahu.
To znamená, že se nemusíte obávat opakovaných nákladů při revizi textu. Ke svému textu se můžete vrátit později a pracovat s ním.
Nad touto hranicí se používá režim knihy pro rychlejší nahrávání velkých textů, zpracování po velkých blocích textu namísto vět. Speechgen dokáže nahrát až 2 000 000 znaků najednou, ale úsporné cachování funguje do 100 000 znaků.
Nahrané věty jsou v paměti uloženy pouze 1 týden. Máte 7 dní na doplnění nebo revizi hlasové nahrávky.
Navíc ve vašem profilu je kompletní historie hlasových nahrávek uložena po dobu 30 dnů. To znamená, že během 30 dnů si můžete stáhnout text a soubor v jejich úplnosti. Samotná cache však bude uložena pouze 7 dní.
Pokud se například rozhodnete přidat k hlasové nahrávce po 25 dnech, limity se znovu odečtou za celý projekt. Uložením hlasové nahrávky do oblíbených si můžete zvukový záznam s textem uchovat navždy, ale cache bude stále uložena pouze 7 dní.
Váš text a zvukový soubor jsou uloženy ve vašem profilu, ale ne cache, takže na to prosím pamatujte při práci.
Cache funguje pouze pro nezměněné věty. Pokud změníte byť jen jedno písmeno nebo odstraníte čárku ve větě, systém ji považuje za novou.
Původní text:
Přidání nové věty:
Výsledek: Speechgen vezme první tři věty z cache a nahraje pouze čtvrtou. Náklady jsou účtovány pouze za čtvrtou větu.
Původní text:
Změna jednoho slova ve druhé větě:
Výsledek: Speechgen vezme první a třetí větu z cache, ale druhou větu nahraje znovu.
Původní text:
Odstranění čárek ve třetí větě:
Výsledek: Speechgen znovu nahraje třetí větu a první a druhou větu vezme z cache. Třetí věta je považována za změněnou kvůli odstranění čárek.
Pokud přidáte nový tag pro pauzu, jako je break, je to také považováno za změnu věty. Systém ji znovu analyzuje a nahraje.
<break time="200ms"/>
Ve skutečnosti jsou věty z úsporné cache načítány na základě úplné shody, znak po znaku. Pokud je v textu nový znak nebo nějaký znak chybí, program jej nemůže přesně shodovat.
Pokud změníte nastavení rychlosti nebo tónu, bude se jednat o zcela novou hlasovou nahrávku a úsporné cachování nebude fungovat. Když změníte rychlost nebo tón, neuronová síť znovu nahraje text s těmito novými parametry. Nejedná se o softwarové zrychlení nebo změnu tónu; jedná se o kompletní nové nahrání.
Změna mluvčího také vede k úplnému novému nahrání. Zde neuronová síť provede veškerou práci znovu. Proto, pokud upravujete hlas, udělejte to pro 1-2 věty a jakmile budete spokojeni s rychlostí a tónem, nahrajte celý požadovaný text.
Na této speciální stránce https://speechgen.io/cs/subs/ můžete nahrávat titulky. Aby se vešlo do časování, je často nutné zrychlit řeč, aby odpovídala požadovanému časování. V tomto případě úsporné cachování funguje, protože Speechgen nejprve nahraje a poté programově zrychlí titulky.
Pauzy můžete změnit v nastavení pod polem pro nahrávání a cache bude fungovat bezchybně. Ukládáme celé věty do paměti a systém je pak spojuje do zvuku. Tímto způsobem můžete upravit pauzy mezi větami nebo odstavci bez dalších nákladů.
Pokud vyberete jiný formát – ogg, wav, opus – a stisknete revoice, systém vám neúčtuje žádné limity. Je to zdarma. Pokud jste nahráli a pak zjistili, že potřebujete jiný formát, změňte jej bez obav z dvojitých nákladů.
Pokud změníte vzorkovací frekvenci v nastavení a znovu stisknete revoice, systém vám neúčtuje žádné limity. Je to zdarma.
Úsporný systém cachování Speechgenu nabízí významné výhody:
Speechgen šetří vaše zdroje a poskytuje nástroje pro efektivnější práci se zvukovým obsahem, což z něj činí ideální volbu pro ty, kteří si cení efektivity a kvality v syntéze řeči.