08-09-2025 , 16-09-2025
Otvorte rozbaľovaciu ponuku jazykov a vyberte jazyk vášho textu. Podporované jazyky: Viac ako 150 jazykov (knižnica hlasov AI).
Po výbere jazyka sa zobrazí zoznam hlasov. Vypočujte si ukážky a vyberte si svoj obľúbený.
Skopírujte svoj text do textového poľa alebo nahrajte súbor (DOCX, PDF). Na prevod titulkov na reč použite špecializovanú stránku SRT na hlas.
Počkajte na spracovanie a stiahnite si hotový zvukový súbor.
To je všetko! Váš prvý hlasový prejav je pripravený za pár minút.
💡 Tip: Pri kopírovaní z PDF súborov venujte textu osobitnú pozornosť — môžu sa objaviť neviditeľné znaky, ktoré pokazia zvuk!
Maximálne na generovanie: 2 000 000 znakov (≈ 285 000 – 330 000 slov) – to je pôsobivé množstvo textu, ktoré môžete previesť na reč v jednom generovaní, čo je ideálne pre dlhý obsah, ako sú celé knihy alebo rozsiahla dokumentácia.
⚠️ Dôležité: Najprv vyberte správny jazyk pre váš text.
Po výbere jazyka sa otvorí zoznam dostupných hlasov. Vypočujte si ukážky kliknutím na tlačidlo prehrávania pri každom hlase, aby ste našli ten, ktorý najlepšie vyhovuje vašim potrebám. Uvidíte rôzne typy hlasov: bežné hlasy ponúkajú štandardnú kvalitu, PRO hlasy poskytujú zlepšenú kvalitu a prirodzenosť a viacjazyčné hlasy (označené kódmi jazykov ako Ava_US, Ava_ES) vám umožňujú zachovať konzistenciu hlasu naprieč rôznymi jazykmi. Nájdite si čas na vypočutie každého hlasu, pretože sa výrazne líšia tónom, emóciami a charakterom.
Pod textovým poľom, nad tlačidlom generovania, môžete nastaviť prestávky:
Kliknite na tlačidlo „Generovať reč“ pod textovým poľom, aby ste spustili proces prevodu. Čas spracovania závisí od dĺžky vášho textu – kratšie texty sa dokončia za sekundy, zatiaľ čo dlhšie dokumenty môžu trvať niekoľko minút. Po dokončení generovania si budete môcť výsledok vypočuť priamo v prehliadači, aby ste sa uistili, že spĺňa vaše očakávania.
Po dokončení generovania sa zobrazí tlačidlo „Stiahnuť“. Predvolene si súbor môžete jednoducho stiahnuť ako MP3. Ak však potrebujete iný formát (WAV alebo OPUS) alebo chcete zmeniť kvalitu zvuku (vzorkovacia frekvencia od 8000 do 44000 Hz), musíte najprv vybrať tieto možnosti z rozbaľovacích ponúk, znova vygenerovať reč s vybranými nastaveniami a potom stiahnuť súbor s preferovanými špecifikáciami.
Škála rýchlosti:
Prečo táto škála: Zlomkové hodnoty menšie ako 1 spomaľujú reč, väčšie ako 1 ju zrýchľujú. To umožňuje presný výber tempa pre vaše publikum.
Odporúčania pre rýchlosť:
Rozsah výšky tónu: od -20 do +20 s krokom 2.
Prečo krok 2: Krok 2 jednotiek poskytuje citeľnú, ale nie ostrú zmenu výšky tónu. Menšie kroky by neboli postrehnuteľné, väčšie kroky by boli príliš dramatické.
Vplyv výšky tónu:
Použitie:
Prestávky medzi vetami: 300 ms (predvolené).
Prestávky medzi odsekmi: 400 ms (predvolené).
Tieto nastavenia je možné zmeniť v rozbaľovacích ponukách od 150 ms do 30 sekúnd.
Cez rozhranie:
Cez značky:
Na požadované miesto vložte značku <break time="200ms"/> alebo <break time="2s"/>.
Pravidlá pre prestávky:
Kedy použiť prestávky:
Funkcia dialógu umožňuje použiť rôzne hlasy v jednom texte.
Funkcia dialógu s viacerými hlasmi otvára kreatívne možnosti nad rámec iba hlasov postáv. Napríklad učitelia cudzích jazykov môžu túto funkciu použiť na demonštráciu tej istej frázy pri rôznych rýchlostiach na učenie sa jazykov, čím pomáhajú študentom pochopiť výslovnosť pri rôznych úrovniach porozumenia. Podrobné techniky a aplikácie v triede nájdete v našom návode na používanie prevodu textu na reč pre výučbu cudzích jazykov.
Hlasy s kódmi jazykov (napr. Ava_US, Ava_ES, Ava_DE) sú navrhnuté tak, aby zachovali konzistentné rozpoznávanie hlasu naprieč rôznymi jazykmi. Tieto viacjazyčné hlasy vám umožňujú vytvoriť jednotný štýl pre viacjazyčný obsah, čím zaisťujú, že rovnaká osobnosť hlasu môže plynule hovoriť viacerými jazykmi. Táto funkcia je obzvlášť užitočná v režime dialógu, kde môžete prepínať medzi jazykmi a zároveň si zachovať rovnakú rozpoznateľnú osobnosť hlasu počas celého zvukového projektu.
SpeechGen vám umožňuje rozdeliť váš generovaný zvuk na viacero segmentov v rámci jedného projektu syntézy, čo je ideálne pre video editorov, ktorí potrebujú samostatné zvukové súbory pre rôzne scény alebo kapitoly. Táto funkcia je obzvlášť užitočná pri vytváraní hlasových prejavov pre videá na YouTube, online kurzy alebo akýkoľvek projekt vyžadujúci presnú synchronizáciu zvuku.
Na rozdelenie zvuku jednoducho umiestnite kurzor tam, kde chcete rozdeliť text, a kliknite na tlačidlo „rezať“ v paneli menu. Tým sa na tomto mieste vloží značka <cut/>. Túto značku môžete tiež manuálne napísať alebo skopírovať a vložiť do celého textu. Pre vlastné názvy súborov použite tento formát:
<cut name="váš-názov-súboru"/>
Táto funkcia vám pomôže organizovať segmenty s výstižnými názvami ako:
<cut name="úvod"/>
<cut name="kapitola-1"/>
Po pridaní aspoň jednej značky segmentu sa po generovaní zobrazí tlačidlo „stiahnuť segmenty“. Kliknutím naň stiahnete všetky segmenty naraz, alebo použite tlačidlo „viac“ na prehrávači zvuku na prístup k jednotlivým segmentom. Každý súbor je automaticky pomenovaný jedinečným ID, číslom sekvencie a popisným názvom (napr. „7054789_1_prvá-veta“), čo uľahčuje identifikáciu a organizáciu vašich zvukových súborov vo vašom editačnom softvéri.
Pre väčšie projekty ich rozdeľte do viacerých generovaní. Komplexné pokyny, pokročilé techniky a video návody nájdete v našej kompletnej dokumentácii k segmentácii zvuku.
Niektoré hlasy majú grafy intonácie:
Grafy intonácie sú k dispozícii pri hlasoch, ktoré zobrazujú ikonu nastavenia vedľa názvu hlasu – táto funkcia sa nachádza na viac ako polovici hlasov v knižnici, vrátane bežných aj PRO možností.
Vyberte vetu, pri ktorej chcete upraviť intonáciu, a stlačte tlačidlo intonácia. Zobrazí sa toto rozhranie.
SpeechGen. používa inteligentný systém vyrovnávacej pamäte, ktorý výrazne šetrí vaše limity. Systém funguje tak, že ukladá každú vetu (až do 100 000 znakov) do vyrovnávacej pamäte na 7 dní. Keď znovu generujete zvuk, všetky nezmenené vety sa automaticky načítajú z vyrovnávacej pamäte zadarmo – platíte iba za nové alebo upravené vety. To znamená, že môžete vykonávať postupné úpravy textu bez toho, aby ste pri každej úprave spotrebovali celý svoj povolený počet znakov. História projektov sa uchováva 30 dní a súbory, ktoré pridáte do obľúbených, sa uchovávajú natrvalo.
Obdobia uchovávania:
Hlas znie neprirodzene:
Nesprávna výslovnosť:
Neprirodzené prestávky:
Chyby SSML:
Pre odborné ovládanie hlasu použite SSML značky:
⚠️ Pozor: Rôzne hlasy podporujú rôzne sady SSML značiek. Otestujte funkčnosť pre každý konkrétny hlas.
API je k dispozícii pre vývojárov na integráciu SpeechGen.io do ich vlastných aplikácií a služieb.
Najprv skontrolujte, či je váš súbor v podporovanom formáte (DOCX, PDF alebo TXT). Uistite sa, že súbor nie je poškodený a skúste ho nahrať znova. Ak problém pretrváva, skopírujte text manuálne a vložte ho priamo do textového poľa. Tiež skontrolujte, či veľkosť vášho súboru nepresahuje limity platformy.
Vaša história projektov sa automaticky ukladá na 30 dní. Inteligentná vyrovnávacia pamäť (pre úsporu na úrovni viet) trvá 7 dní. Ak chcete súbory uchovať natrvalo, pridajte ich do svojich obľúbených. Týmto zabezpečíte, že vaše dôležité zvukové projekty nebudú nikdy stratené a zostanú dostupné vo vašom profile.
Áno! SpeechGen ponúka generovanie zvuku s viacerými hlasmi (režim dialógu). Môžete priradiť rôzne hlasy rôznym častiam textu, čo je ideálne pre audioknihy s viacerými postavami, vzdelávacie dialógy alebo podcasty s viacerými rečníkmi. Môžete dokonca použiť viacjazyčné hlasy na prepínanie medzi jazykmi pri zachovaní konzistencie postáv.
PRO hlasy ponúkajú vynikajúcu kvalitu a prirodzenosť v porovnaní s bežnými hlasmi. Zvyčajne majú lepšie vyjadrenie emócií, presnejšiu výslovnosť a niektoré podporujú pokročilé funkcie, ako sú grafy intonácie. Pre profesionálne projekty, ako sú audioknihy, kurzy alebo obchodné prezentácie, sa odporúčajú PRO hlasy.
Závisí to od toho, ktoré nastavenia zmeníte. Úprava rýchlosti reči alebo výšky tónu vyžaduje úplné opätovné generovanie a spotrebuje vaše limity znakov, pretože tieto zmeny ovplyvňujú celú syntézu hlasu. Môžete však voľne meniť prestávky medzi vetami a odsekmi bez spotreby limitov. Okrem toho SpeechGen používa inteligentnú vyrovnávaciu pamäť: ak vygenerujete dlhý text, potom upravíte iba jednu vetu a znovu vygenerujete, systém vám naúčtuje iba tú jednu zmenenú vetu, nie celý text. Tento systém vyrovnávacej pamäte uchováva vaše nezmenené vety po dobu 7 dní, vďaka čomu je iteratívne úpravy veľmi úsporné.
Získajte pomoc od našej komunity! Pýtajte sa v našej skupine na Telegrame: https://t.me/speechgen