15-09-2025 , 16-09-2025
Otvorite padajući meni za jezike i izaberite jezik vašeg teksta. Podržani jezici: Preko 150 jezika (biblioteka AI glasova).
Nakon odabira jezika, pojaviće se lista glasova. Poslušajte primere i izaberite svoj omiljeni.
Kopirajte svoj tekst u polje za tekst ili otpremite datoteku (DOCX, PDF). Za pretvaranje titlova u govor, koristite namenski SRT u glas stranicu.
Sačekajte obradu i preuzmite svoju gotovu audio datoteku.
To je to! Vaš prvi glasovni zapis je spreman za samo nekoliko minuta.
💡 Savet: Prilikom kopiranja iz PDF datoteka, obratite posebnu pažnju na tekst — mogu se pojaviti nevidljivi znakovi koji će pokvariti zvuk!
Maksimalno po generaciji: 2.000.000 karaktera (≈ 285.000-330.000 reči) - ovo je impresivna količina teksta koju možete pretvoriti u govor u jednoj generaciji, što ga čini idealnim za duge sadržaje poput celih knjiga ili opsežne dokumentacije.
⚠️ Važno: Prvo izaberite ispravan jezik za svoj tekst.
Nakon odabira jezika, otvoriće se lista dostupnih glasova. Poslušajte primere klikom na dugme za reprodukciju za svaki glas kako biste pronašli onaj koji najbolje odgovara vašim potrebama. Videćete različite tipove glasova na raspolaganju: Redovni glasovi nude standardni kvalitet, PRO glasovi pružaju poboljšani kvalitet i prirodnost, a Višejezični glasovi (označeni kodovima jezika kao što su Ava_US, Ava_ES) omogućavaju vam da održite konzistentnost glasa preko različitih jezika. Odvojite vreme da pregledate svaki glas jer se značajno razlikuju po tonu, emociji i karakteru.
Ispod polja za tekst, iznad dugmeta za generisanje, možete podesiti postavke pauze:
Kliknite na dugme "Generiši govor" ispod polja za tekst da biste započeli proces konverzije. Vreme obrade zavisi od dužine vašeg teksta - kraći tekstovi se završavaju za sekunde, dok duži dokumenti mogu potrajati nekoliko minuta. Kada se generisanje završi, moći ćete da slušate rezultat direktno u pregledaču kako biste se uverili da ispunjava vaša očekivanja.
Nakon završetka generisanja, pojaviće se dugme "Preuzmi". Podrazumevano, možete jednostavno preuzeti datoteku kao MP3. Međutim, ako vam je potreban drugačiji format (WAV ili OPUS) ili želite da promenite kvalitet zvuka (frekvencija uzorkovanja od 8000 do 44000 Hz), prvo morate izabrati te opcije iz padajućih menija, ponovo generisati govor sa izabranim postavkama, a zatim preuzeti datoteku sa vašim željenim specifikacijama.
Skala brzine:
Zašto ova skala: Fraktalne vrednosti manje od 1 usporavaju govor, veće od 1 ubrzavaju. Ovo omogućava precizan odabir tempa za vašu publiku.
Preporuke za brzinu:
Opseg visine: od -20 do +20 sa korakom 2.
Zašto korak 2: Korak od 2 jedinice pruža primetnu, ali ne oštru promenu visine. Manji koraci bi bili neprimetni, veći koraci previše dramatični.
Uticaj visine:
Primene:
Pauze između rečenica: 300ms (podrazumevano).
Pauze između paragrafa: 400ms (podrazumevano).
Ova podešavanja se mogu promeniti u padajućim menijima od 150ms do 30 sekundi.
Kroz interfejs:
Kroz tagove:
Umetnite tag <break time="200ms"/> ili <break time="2s"/> na željenom mestu.
Pravila za pauze:
Kada koristiti pauze:
Funkcija dijalog omogućava korišćenje različitih glasova u jednom tekstu.
Funkcija dijaloga sa više glasova otvara kreativne mogućnosti izvan samo glasova likova. Nastavnici stranih jezika, na primer, mogu koristiti ovu funkciju da prikažu istu frazu različitim brzinama za učenje jezika, pomažući učenicima da savladaju izgovor na različitim nivoima razumevanja. Za detaljne tehnike i primene u učionici, pogledajte naše uputstvo o korišćenju pretvaranja teksta u govor za nastavu stranih jezika.
Glasovi sa kodovima jezika (npr. Ava_US, Ava_ES, Ava_DE) dizajnirani su da održe dosledno prepoznavanje glasa preko različitih jezika. Ovi višejezični glasovi vam omogućavaju da stvorite jedinstven stil za višejezični sadržaj, osiguravajući da isti karakter glasa može govoriti više jezika bez problema. Ova funkcija je posebno korisna u režimu dijaloga, gde možete prelaziti između jezika zadržavajući istu prepoznatljivu ličnost glasa tokom vašeg audio projekta.
SpeechGen vam omogućava da podelite svoj generisani audio na više segmenata unutar jednog projekta sinteze, što ga čini savršenim za video urednike kojima su potrebne odvojene audio datoteke za različite scene ili poglavlja. Ova funkcija je posebno korisna za kreiranje glasovnih snimaka za YouTube video snimke, online kurseve ili bilo koji projekat koji zahteva preciznu sinhronizaciju zvuka.
Da biste podelili svoj audio, jednostavno postavite kursor tamo gde želite da podelite tekst i kliknite na dugme za sečenje u panelu menija. Ovo ubacuje <cut/> tag na toj poziciji. Takođe možete ručno upisati ili kopirati/zalepiti ovaj tag kroz vaš tekst. Za prilagođena imena datoteka, koristite ovaj format:
<cut name="vaše-ime-datoteke"/>
Ova funkcija vam pomaže da organizujete segmente sa smislenim imenima kao što su:
<cut name="uvod"/>
<cut name="poglavlje-1"/>
Kada dodate najmanje jedan tag za segment, dugme "preuzmi segmente" se pojavljuje nakon generisanja. Kliknite na njega da biste preuzeli sve segmente odjednom, ili koristite dugme "više" na audio plejeru da biste pristupili pojedinačnim segmentima. Svaka datoteka se automatski imenuje jedinstvenim ID-om, brojem sekvence i opisnim naslovom (npr. "7054789_1_prva-recenica"), što olakšava identifikaciju i organizaciju vaših audio datoteka u vašem softveru za uređivanje.
Za veće projekte, podelite ih na više generacija. Za potpuna uputstva, napredne tehnike i video tutorijale, posetite našu kompletnu dokumentaciju o segmentaciji zvuka.
Neki glasovi imaju grafike intonacije:
Grafike intonacije su dostupne za glasove koji prikazuju ikonicu podešavanja pored imena glasa - ova funkcija se nalazi na više od polovine glasova u biblioteci, uključujući i redovne i PRO opcije.
Izaberite rečenicu u kojoj želite da prilagodite intonaciju i pritisnite dugme intonacija. Pojaviće se ovaj interfejs.
SpeechGen. koristi inteligentni sistem keširanja koji značajno štedi vaše limite. Sistem radi tako što svaku rečenicu (do 100.000 karaktera) kešira na 7 dana. Kada ponovo generišete svoj audio, sve nepromenjene rečenice se automatski preuzimaju iz keša besplatno - plaćate samo za nove ili izmenjene rečenice. To znači da možete vršiti postepene izmene svog teksta bez trošenja celokupnog karakternog dodatka svaki put. Istorija projekata se čuva 30 dana, a datoteke koje dodate u omiljene čuvaju se trajno.
Periodi skladištenja:
Glas zvuči neprirodno:
Netačan izgovor:
Neprirodne pauze:
SSML greške:
Za stručnu kontrolu glasa, koristite SSML tagove:
⚠️ Pažnja: Različiti glasovi podržavaju različite setove SSML tagova. Testirajte funkcionalnost za svaki specifični glas.
API je dostupan za programere za integraciju SpeechGen.io u njihove sopstvene aplikacije i usluge.
Prvo proverite da li je vaš fajl u podržanom formatu (DOCX, PDF ili TXT). Uverite se da fajl nije oštećen i pokušajte ponovo da ga otpremite. Ako problem i dalje postoji, kopirajte tekst ručno i zalepite ga direktno u polje za tekst. Takođe proverite da li veličina vašeg fajla ne prelazi ograničenja platforme.
Istorija vaših projekata se automatski čuva 30 dana. Pametni keš (za uštede na nivou rečenica) traje 7 dana. Da biste sačuvali fajlove trajno, dodajte ih u svoje omiljene. Ovo osigurava da vaši važni audio projekti nikada ne budu izgubljeni i da ostanu dostupni u vašem profilu.
Da! SpeechGen nudi generisanje audio zapisa sa više glasova (režim dijaloga). Možete dodeliti različite glasove različitim delovima teksta, što ga čini savršenim za audio knjige sa više likova, obrazovne dijaloge ili podkaste sa više govornika. Možete čak koristiti višejezične glasove da prelazite između jezika, zadržavajući doslednost karaktera glasa.
PRO glasovi nude superiorniji kvalitet i prirodnost u poređenju sa redovnim glasovima. Oni obično imaju bolju emocionalnu ekspresiju, precizniji izgovor, a neki podržavaju napredne funkcije poput grafika intonacije. Za profesionalne projekte kao što su audio knjige, kursevi ili poslovne prezentacije, preporučuju se PRO glasovi.
Zavisi od toga koje postavke menjate. Podešavanje brzine govora ili visine tona zahteva potpunu regeneraciju i troši vaše karaktere, jer ove promene utiču na celokupnu sintezu glasa. Međutim, možete slobodno menjati pauze između rečenica i paragrafa bez ikakvog trošenja limita. Dodatno, SpeechGen koristi pametno keširanje: ako generišete dug tekst, zatim izmenite samo jednu rečenicu i ponovo generišete, sistem će vam naplatiti samo tu jednu izmenjenu rečenicu, a ne ceo tekst. Ovaj sistem keširanja čuva vaše nepromenjene rečenice 7 dana, čineći iterativno uređivanje veoma ekonomičnim.
Potražite pomoć u našoj zajednici! Postavite svoja pitanja u našem Telegram četu: https://t.me/speechgen