Ako používať prevod textu na reč na SpeechGen.io: Kompletný návod

08-09-2025 , 16-09-2025

🚀 Rýchly štart — Vytvorte zvuk v 4 krokoch

Krok 1: Vyberte jazyk

Otvorte rozbaľovaciu ponuku jazykov a vyberte jazyk vášho textu. Podporované jazyky: Viac ako 150 jazykov (knižnica hlasov AI).

Krok 2: Vyberte hlas

Po výbere jazyka sa zobrazí zoznam hlasov. Vypočujte si ukážky a vyberte si svoj obľúbený.

Krok 3: Vložte text

Skopírujte svoj text do textového poľa alebo nahrajte súbor (DOCX, PDF). Na prevod titulkov na reč použite špecializovanú stránku SRT na hlas.

Krok 4: Kliknite na „Generovať reč“ (modré tlačidlo)

Krok 4: Kliknite na Generovať reč

Počkajte na spracovanie a stiahnite si hotový zvukový súbor.

To je všetko! Váš prvý hlasový prejav je pripravený za pár minút.

Príprava textu

Odporúčané:

Používajte čistý text bez zbytočných symbolov.
Správne umiestnite interpunkčné znamienka (bodky, čiarky, výkričníky).
Rozdeľte dlhý text na odseky.

Vyhnite sa:

Emotikonom a smajlíkom (môžu narušiť generovanie zvuku).
Exotickým symbolom: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
Špeciálnym symbolom Unicode:

💡 Tip: Pri kopírovaní z PDF súborov venujte textu osobitnú pozornosť — môžu sa objaviť neviditeľné znaky, ktoré pokazia zvuk!

Limity a obmedzenia

Podporované jazyky: 150+ jazykov (úplný zoznam).
Formáty nahrávania: čistý text, DOCX, PDF, SRT.

Maximálne na generovanie: 2 000 000 znakov (≈ 285 000 – 330 000 slov) – to je pôsobivé množstvo textu, ktoré môžete previesť na reč v jednom generovaní, čo je ideálne pre dlhý obsah, ako sú celé knihy alebo rozsiahla dokumentácia.

Podrobné pokyny krok za krokom

Krok 1: Nahrajte text

Vložte text: Skopírujte svoj text do textového poľa.
Nahrajte súbor: Alebo kliknite na tlačidlo nahrávania a vyberte súbor (DOCX, PDF).
Skontrolujte text: Uistite sa, že sa text zobrazuje správne.

Krok 2: Vyberte jazyk

⚠️ Dôležité: Najprv vyberte správny jazyk pre váš text.

Otvorte rozbaľovaciu ponuku jazykov.
Nájdite potrebný jazyk (k dispozícii je viac ako 150 jazykov).
Pre viacjazyčné texty použite generovanie zvuku s viacerými hlasmi.

Krok 3: Vyberte hlas

Po výbere jazyka sa otvorí zoznam dostupných hlasov. Vypočujte si ukážky kliknutím na tlačidlo prehrávania pri každom hlase, aby ste našli ten, ktorý najlepšie vyhovuje vašim potrebám. Uvidíte rôzne typy hlasov: bežné hlasy ponúkajú štandardnú kvalitu, PRO hlasy poskytujú zlepšenú kvalitu a prirodzenosť a viacjazyčné hlasy (označené kódmi jazykov ako Ava_US, Ava_ES) vám umožňujú zachovať konzistenciu hlasu naprieč rôznymi jazykmi. Nájdite si čas na vypočutie každého hlasu, pretože sa výrazne líšia tónom, emóciami a charakterom.

Krok 4: Nastavte parametre

Rýchlosť reči: od x0.1 (veľmi pomalá) do x2.2 (veľmi rýchla).
Výška hlasu: od -20 do +20 (krok 2).

Pod textovým poľom, nad tlačidlom generovania, môžete nastaviť prestávky:

nastavenie prestávok

Prestávky medzi vetami: 150 ms – 30 sekúnd.
Prestávky medzi odsekmi: 150 ms – 30 sekúnd.

Krok 5: Generujte reč

Kliknite na tlačidlo „Generovať reč“ pod textovým poľom, aby ste spustili proces prevodu. Čas spracovania závisí od dĺžky vášho textu – kratšie texty sa dokončia za sekundy, zatiaľ čo dlhšie dokumenty môžu trvať niekoľko minút. Po dokončení generovania si budete môcť výsledok vypočuť priamo v prehliadači, aby ste sa uistili, že spĺňa vaše očakávania.

Krok 6: Stiahnite si

Po dokončení generovania sa zobrazí tlačidlo „Stiahnuť“. Predvolene si súbor môžete jednoducho stiahnuť ako MP3. Ak však potrebujete iný formát (WAV alebo OPUS) alebo chcete zmeniť kvalitu zvuku (vzorkovacia frekvencia od 8000 do 44000 Hz), musíte najprv vybrať tieto možnosti z rozbaľovacích ponúk, znova vygenerovať reč s vybranými nastaveniami a potom stiahnuť súbor s preferovanými špecifikáciami.

Nastavenia zvukových parametrov

Rýchlosť reči

Škála rýchlosti:

x0.1 – x0.9: Spomalenie (pre zložité materiály, učenie sa jazykov).
x1.0: Normálna rýchlosť (predvolená).
x1.1 – x2.2: Zrýchlenie (pre dynamický obsah).

Prečo táto škála: Zlomkové hodnoty menšie ako 1 spomaľujú reč, väčšie ako 1 ju zrýchľujú. To umožňuje presný výber tempa pre vaše publikum.

Odporúčania pre rýchlosť:

Vzdelávanie: x0.8–x1.0 (pre lepšie pochopenie).
Prezentácie: x0.9–x1.1 (oficiálne tempo).
Podcasty: x1.0–x1.2 (živé tempo).
YouTube: x1.1–x1.4 (udržanie pozornosti).

Výška hlasu

Rozsah výšky tónu: od -20 do +20 s krokom 2.

Prečo krok 2: Krok 2 jednotiek poskytuje citeľnú, ale nie ostrú zmenu výšky tónu. Menšie kroky by neboli postrehnuteľné, väčšie kroky by boli príliš dramatické.

Vplyv výšky tónu:

Záporné hodnoty (-2 až -20): Hlas je nižší, vážnejší, autoritatívnejší.
Kladné hodnoty (+2 až +20): Hlas je vyšší, priateľskejší, energickejší.
0: Neutrálna výška tónu (predvolená).

Použitie:

Obchodný obsah: -4 až +2.
Detský obsah: +4 až +12.
Dramatický obsah: -8 až -16.
Priateľský obsah: +2 až +8.

Práca s prestávkami

Automatické prestávky

Prestávky medzi vetami: 300 ms (predvolené).

Prestávky medzi odsekmi: 400 ms (predvolené).

Tieto nastavenia je možné zmeniť v rozbaľovacích ponukách od 150 ms do 30 sekúnd.

Manuálne vkladanie prestávok

Cez rozhranie:

Umiestnite kurzor na požadované miesto v texte.
Kliknite na tlačidlo „Prestávka“ v menu.
V texte sa zobrazí symbol .-.

Cez značky:

Na požadované miesto vložte značku <break time="200ms"/> alebo <break time="2s"/>.

Pravidlá pre prestávky:

Maximálna prestávka: 30 sekúnd.
Na dlhšie oneskorenie je možné vložiť viacero prestávok za sebou.
Prestávky nespotrebúvajú dodatočné limity.

Kedy použiť prestávky:

Pred dôležitými vyhláseniami.
Po rečníckych otázkach.
Medzi rôznymi témami.
Na vytvorenie dramatického efektu.

Zvuk s viacerými hlasmi

Funkcia dialógu umožňuje použiť rôzne hlasy v jednom texte.

Použitie:

Audioknihy: Rôzne hlasy pre postavy.
Vzdelávacie dialógy: Učiteľ a žiak.
Prezentácie: Hlavný rečník a komentátor.
Podcasty: Viacerí moderátori.

Funkcia dialógu s viacerými hlasmi otvára kreatívne možnosti nad rámec iba hlasov postáv. Napríklad učitelia cudzích jazykov môžu túto funkciu použiť na demonštráciu tej istej frázy pri rôznych rýchlostiach na učenie sa jazykov, čím pomáhajú študentom pochopiť výslovnosť pri rôznych úrovniach porozumenia. Podrobné techniky a aplikácie v triede nájdete v našom návode na používanie prevodu textu na reč pre výučbu cudzích jazykov.

Výber hlasu

Viacjazyčné hlasy

Hlasy s kódmi jazykov (napr. Ava_US, Ava_ES, Ava_DE) sú navrhnuté tak, aby zachovali konzistentné rozpoznávanie hlasu naprieč rôznymi jazykmi. Tieto viacjazyčné hlasy vám umožňujú vytvoriť jednotný štýl pre viacjazyčný obsah, čím zaisťujú, že rovnaká osobnosť hlasu môže plynule hovoriť viacerými jazykmi. Táto funkcia je obzvlášť užitočná v režime dialógu, kde môžete prepínať medzi jazykmi a zároveň si zachovať rovnakú rozpoznateľnú osobnosť hlasu počas celého zvukového projektu.

Segmentácia zvuku

SpeechGen vám umožňuje rozdeliť váš generovaný zvuk na viacero segmentov v rámci jedného projektu syntézy, čo je ideálne pre video editorov, ktorí potrebujú samostatné zvukové súbory pre rôzne scény alebo kapitoly. Táto funkcia je obzvlášť užitočná pri vytváraní hlasových prejavov pre videá na YouTube, online kurzy alebo akýkoľvek projekt vyžadujúci presnú synchronizáciu zvuku.

Ako vytvoriť segmenty

Na rozdelenie zvuku jednoducho umiestnite kurzor tam, kde chcete rozdeliť text, a kliknite na tlačidlo „rezať“ v paneli menu. Tým sa na tomto mieste vloží značka <cut/>. Túto značku môžete tiež manuálne napísať alebo skopírovať a vložiť do celého textu. Pre vlastné názvy súborov použite tento formát:

<cut name="váš-názov-súboru"/>

Táto funkcia vám pomôže organizovať segmenty s výstižnými názvami ako:

<cut name="úvod"/>

<cut name="kapitola-1"/>

Sťahovanie a správa segmentov

Po pridaní aspoň jednej značky segmentu sa po generovaní zobrazí tlačidlo „stiahnuť segmenty“. Kliknutím naň stiahnete všetky segmenty naraz, alebo použite tlačidlo „viac“ na prehrávači zvuku na prístup k jednotlivým segmentom. Každý súbor je automaticky pomenovaný jedinečným ID, číslom sekvencie a popisným názvom (napr. „7054789_1_prvá-veta“), čo uľahčuje identifikáciu a organizáciu vašich zvukových súborov vo vašom editačnom softvéri.

Obmedzenia segmentov

Krátke segmenty: Až 1000 segmentov na generovanie.
Dlhé segmenty: Až 500 segmentov na generovanie.

Pre väčšie projekty ich rozdeľte do viacerých generovaní. Komplexné pokyny, pokročilé techniky a video návody nájdete v našej kompletnej dokumentácii k segmentácii zvuku.

Nastavenie intonácie

Niektoré hlasy majú grafy intonácie:

Grafy intonácie sú k dispozícii pri hlasoch, ktoré zobrazujú ikonu nastavenia vedľa názvu hlasu – táto funkcia sa nachádza na viac ako polovici hlasov v knižnici, vrátane bežných aj PRO možností.

Potiahnite body na grafe na zmenu intonácie.
Zdvihnite body na zvýšenie výšky tónu pri určitých slovách.
Spustite body na vytvorenie vážnejšieho tónu.
Experimentujte s rôznymi krivkami pre prirodzenosť.

Potiahnite body na grafe na zmenu intonácie

Vyberte vetu, pri ktorej chcete upraviť intonáciu, a stlačte tlačidlo intonácia. Zobrazí sa toto rozhranie.

Systém vyrovnávacej pamäte a úspora limitov

Inteligentná vyrovnávacia pamäť

SpeechGen. používa inteligentný systém vyrovnávacej pamäte, ktorý výrazne šetrí vaše limity. Systém funguje tak, že ukladá každú vetu (až do 100 000 znakov) do vyrovnávacej pamäte na 7 dní. Keď znovu generujete zvuk, všetky nezmenené vety sa automaticky načítajú z vyrovnávacej pamäte zadarmo – platíte iba za nové alebo upravené vety. To znamená, že môžete vykonávať postupné úpravy textu bez toho, aby ste pri každej úprave spotrebovali celý svoj povolený počet znakov. História projektov sa uchováva 30 dní a súbory, ktoré pridáte do obľúbených, sa uchovávajú natrvalo.

Obdobia uchovávania:

Vyrovnávacia pamäť viet: 7 dní.
História projektov: 30 dní.
Obľúbené súbory: Uchovávané natrvalo.

Riešenie bežných problémov

Problémy s kvalitou zvuku

Hlas znie neprirodzene:

Vyskúšajte PRO hlasy.
Znížte rýchlosť na x0.9–x1.1.
Skontrolujte správnosť interpunkcie.
Použite neutrálny tón (0).

Nesprávna výslovnosť:

Uistite sa, že je vybratý správny jazyk.
Zložité slová napíšte foneticky.
Použite SSML značky pre presné ovládanie.

Neprirodzené prestávky:

Skontrolujte interpunkciu.
Nastavte prestávky medzi vetami.
Použite manuálne prestávky .- alebo <break time=""/>.
Odstráňte extra medzery a konce riadkov.

Chyby SSML:

Skontrolujte správnosť značiek.
Nie všetky hlasy podporujú všetky SSML značky.

Ďalšie funkcie

SSML (Speech Synthesis Markup Language)

Pre odborné ovládanie hlasu použite SSML značky:

<break time="2s"/> — prestávky.
<emphasis level="strong"> — dôraz v hlase.
<prosody rate="slow" pitch="low"> — zmena charakteristík reči.

⚠️ Pozor: Rôzne hlasy podporujú rôzne sady SSML značiek. Otestujte funkčnosť pre každý konkrétny hlas.

História a obľúbené

História projektov: Automaticky uložená na 30 dní.
Obľúbené: Pridajte dôležité projekty na trvalé uloženie.

Integrácia a API

API je k dispozícii pre vývojárov na integráciu SpeechGen.io do ich vlastných aplikácií a služieb.

Môj súbor sa nenahráva do SpeechGen. Čo mám robiť?

Najprv skontrolujte, či je váš súbor v podporovanom formáte (DOCX, PDF alebo TXT). Uistite sa, že súbor nie je poškodený a skúste ho nahrať znova. Ak problém pretrváva, skopírujte text manuálne a vložte ho priamo do textového poľa. Tiež skontrolujte, či veľkosť vášho súboru nepresahuje limity platformy.

Ako dlho SpeechGen uchováva moje vygenerované zvukové súbory?

Vaša história projektov sa automaticky ukladá na 30 dní. Inteligentná vyrovnávacia pamäť (pre úsporu na úrovni viet) trvá 7 dní. Ak chcete súbory uchovať natrvalo, pridajte ich do svojich obľúbených. Týmto zabezpečíte, že vaše dôležité zvukové projekty nebudú nikdy stratené a zostanú dostupné vo vašom profile.

Môžem použiť rôzne hlasy pre rôzne postavy v jednom zvukovom súbore?

Áno! SpeechGen ponúka generovanie zvuku s viacerými hlasmi (režim dialógu). Môžete priradiť rôzne hlasy rôznym častiam textu, čo je ideálne pre audioknihy s viacerými postavami, vzdelávacie dialógy alebo podcasty s viacerými rečníkmi. Môžete dokonca použiť viacjazyčné hlasy na prepínanie medzi jazykmi pri zachovaní konzistencie postáv.

Aký je rozdiel medzi bežnými a PRO hlasmi v SpeechGen?

PRO hlasy ponúkajú vynikajúcu kvalitu a prirodzenosť v porovnaní s bežnými hlasmi. Zvyčajne majú lepšie vyjadrenie emócií, presnejšiu výslovnosť a niektoré podporujú pokročilé funkcie, ako sú grafy intonácie. Pre profesionálne projekty, ako sú audioknihy, kurzy alebo obchodné prezentácie, sa odporúčajú PRO hlasy.

Spotrebúva zmena nastavení zvuku moje limity znakov?

Závisí to od toho, ktoré nastavenia zmeníte. Úprava rýchlosti reči alebo výšky tónu vyžaduje úplné opätovné generovanie a spotrebuje vaše limity znakov, pretože tieto zmeny ovplyvňujú celú syntézu hlasu. Môžete však voľne meniť prestávky medzi vetami a odsekmi bez spotreby limitov. Okrem toho SpeechGen používa inteligentnú vyrovnávaciu pamäť: ak vygenerujete dlhý text, potom upravíte iba jednu vetu a znovu vygenerujete, systém vám naúčtuje iba tú jednu zmenenú vetu, nie celý text. Tento systém vyrovnávacej pamäte uchováva vaše nezmenené vety po dobu 7 dní, vďaka čomu je iteratívne úpravy veľmi úsporné.

Video

Stále máte otázky?

Získajte pomoc od našej komunity! Pýtajte sa v našej skupine na Telegrame: https://t.me/speechgen