08-09-2025 , 16-09-2025
Deschide lista derulantă de limbi și selectează limba textului tău. Limbi suportate: Peste 150 de limbi (bibliotecă de voci AI).
După selectarea limbii, va apărea o listă de voci. Ascultă mostre și alege-ți favorita
Copiază textul tău în caseta de text sau încarcă un fișier (DOCX, PDF). Pentru a converti subtitrări în voce, folosește pagina dedicată SRT în voce.
Așteaptă procesarea și descarcă fișierul audio gata
Gata! Primul tău voiceover este pregătit în doar câteva minute.
💡 Sfat: Când copiezi din fișiere PDF, acordă o atenție deosebită textului — pot apărea caractere invizibile care vor strica sunetul!
Maxim per generare: 2.000.000 de caractere (≈ 285.000-330.000 de cuvinte) - aceasta este cantitatea impresionantă de text pe care o poți converti în voce într-o singură generare, fiind ideală pentru conținut de lungă durată, cum ar fi cărți întregi sau documentație extinsă.
⚠️ Important: Mai întâi selectează limba corectă pentru textul tău
După selectarea limbii, se va deschide o listă cu vocile disponibile. Ascultă mostre apăsând butonul de redare pentru fiecare voce pentru a o găsi pe cea care se potrivește cel mai bine nevoilor tale. Vei vedea diferite tipuri de voci disponibile: Vocile Regulate oferă calitate standard, vocile PRO oferă calitate și naturalețe îmbunătățite, iar vocile Multilingve (marcate cu coduri de limbă precum Ava_US, Ava_ES) îți permit să menții consistența vocii pe diferite limbi. Acordă-ți timp să previzualizezi fiecare voce, deoarece acestea variază semnificativ în ton, emoție și caracter.
Sub caseta de text, deasupra butonului de generare, poți ajusta setările pentru pauze:
Apasă butonul "Generează Voce" de sub caseta de text pentru a începe procesul de conversie. Timpul de procesare depinde de lungimea textului tău - textele mai scurte se finalizează în secunde, în timp ce documentele mai lungi pot dura câteva minute. Odată ce generarea este completă, vei putea asculta rezultatul direct în browser pentru a te asigura că corespunde așteptărilor tale.
După finalizarea generării, va apărea un buton "Descarcă". Implicit, poți descărca fișierul ca MP3. Totuși, dacă ai nevoie de un alt format (WAV sau OPUS) sau vrei să schimbi calitatea audio (rata de eșantionare de la 8000 la 44000 Hz), va trebui mai întâi să selectezi aceste opțiuni din meniurile derulante, să regenerezi vocea cu setările alese și apoi să descarci fișierul cu specificațiile preferate.
Scara vitezei:
Scara aceasta: Valorile fracționare mai mici de 1 încetinesc vorbirea, cele mai mari de 1 o accelerează. Acest lucru permite o selecție precisă a tempoului pentru publicul tău.
Recomandări de viteză:
Interval ton: de la -20 la +20 cu pas de 2
De ce pasul 2: Un pas de 2 unități oferă o schimbare de ton perceptibilă, dar nu bruscă. Pașii mai mici ar fi imperceptibili, cei mai mari prea dramatici.
Influența tonului:
Aplicații:
Pauze între propoziții: 300ms (implicit)
Pauze între paragrafe: 400ms (implicit)
Aceste setări pot fi modificate în meniurile derulante de la 150ms la 30 secunde.
Prin interfață:
Prin etichete:
Introdu eticheta <break time="200ms"/> sau <break time="2s"/> în locația dorită
Reguli pentru pauze:
Când să folosești pauze:
Funcția de dialog permite utilizarea diferitelor voci într-un singur text.
Funcția de dialog cu mai multe voci deschide posibilități creative dincolo de simplele voci de personaje. Profesorii de limbi străine, de exemplu, pot folosi această funcție pentru a demonstra aceeași frază la viteze diferite pentru învățarea limbilor străine, ajutând elevii să înțeleagă pronunția la diferite niveluri de înțelegere. Pentru tehnici detaliate și aplicații în clasă, consultați ghidul nostru despre utilizarea text-to-speech pentru predarea limbilor străine.
Vocile cu coduri de limbă (de exemplu, Ava_US, Ava_ES, Ava_DE) sunt concepute pentru a menține o recunoaștere consistentă a vocii pe diferite limbi. Aceste voci multilingve îți permit să creezi un stil unitar pentru conținut multilingv, asigurând că aceeași personalitate vocală poate vorbi mai multe limbi fără probleme. Această funcție este deosebit de utilă în modul dialog, unde poți comuta între limbi păstrând aceeași personalitate vocală recunoscută pe parcursul proiectului tău audio.
SpeechGen îți permite să împarți audio-ul generat în mai multe segmente în cadrul unui singur proiect de sinteză, fiind perfect pentru editorii video care au nevoie de fișiere audio separate pentru diferite scene sau capitole. Această funcție este deosebit de utilă pentru crearea de voiceover-uri pentru videoclipuri YouTube, cursuri online sau orice proiect care necesită o sincronizare audio precisă.
Pentru a-ți împărți audio-ul, pur și simplu plasează cursorul acolo unde vrei să divizezi textul și apasă butonul de tăiere din panoul de meniu. Aceasta inserează o etichetă <cut/> în acea poziție. Poți, de asemenea, să tastezi manual sau să copiezi și să lipești această etichetă în tot textul tău. Pentru nume de fișiere personalizate, folosește acest format:
<cut name="numele-tau-de-fisier"/>
Această funcție te ajută să organizezi segmentele cu nume sugestive, cum ar fi:
<cut name="introducere"/>
<cut name="capitol-1"/>
După ce ai adăugat cel puțin o etichetă de segment, un buton "descarcă segmente" apare după generare. Apasă-l pentru a descărca toate segmentele odată, sau folosește butonul "mai mult" de pe playerul audio pentru a accesa segmentele individuale. Fiecare fișier este denumit automat cu un ID unic, un număr de secvență și un titlu descriptiv (de exemplu, "7054789_1_prima-propozitie"), făcând ușoară identificarea și organizarea fișierelor audio în software-ul tău de editare.
Pentru proiecte mai mari, împarte-le în mai multe generări. Pentru instrucțiuni complete, tehnici avansate și tutoriale video, vizitează documentația noastră completă despre segmentarea audio la segmentarea audio completă.
Unele voci au grafice de intonație:
Graficele de intonație sunt disponibile pe vocile care afișează o pictogramă de setări lângă numele vocii - această funcție se găsește pe mai mult de jumătate din vocile din bibliotecă, incluzând opțiuni regulate și PRO
Selectează propoziția în care vrei să ajustezi intonația și apasă butonul de intonație. Va apărea această interfață.
SpeechGen. folosește un sistem inteligent de cache care îți economisește semnificativ limitele. Sistemul funcționează prin salvarea fiecărei propoziții (până la 100.000 de caractere) în cache timp de 7 zile. Când regenerezi audio-ul, orice propoziție neschimbată este preluată automat din cache gratuit - plătești doar pentru propozițiile noi sau modificate. Acest lucru înseamnă că poți face editări incrementale la textul tău fără a consuma întreaga alocare de caractere de fiecare dată. Istoricul proiectelor este stocat timp de 30 de zile, iar fișierele pe care le adaugi la favorite sunt păstrate permanent.
Perioade de stocare:
Vocea sună nenatural:
Pronunție incorectă:
Pauze nenaturale:
Erori SSML:
Pentru control expert al vocii, folosește etichete SSML:
⚠️ Atenție: Diferite voci suportă seturi diferite de etichete SSML. Testează funcționalitatea pentru fiecare voce specifică.
API-ul este disponibil pentru dezvoltatori pentru a integra SpeechGen.io în propriile aplicații și servicii.
Mai întâi, verifică dacă fișierul tău este într-un format suportat (DOCX, PDF sau TXT). Asigură-te că fișierul nu este corupt și încearcă să-l încarci din nou. Dacă problema persistă, copiază textul manual și lipește-l direct în caseta de text. Verifică, de asemenea, dacă dimensiunea fișierului tău nu depășește limitele platformei.
Istoricul proiectelor tale este salvat automat timp de 30 de zile. Cache-ul inteligent (pentru economisirea la nivel de propoziție) durează 7 zile. Pentru a păstra fișierele permanent, adaugă-le la favorite. Acest lucru asigură că proiectele tale audio importante nu se pierd niciodată și rămân accesibile în profilul tău.
Da! SpeechGen oferă generare audio cu mai multe voci (mod dialog). Poți atribui voci diferite secțiunilor de text diferite, făcându-l perfect pentru cărți audio cu mai multe personaje, dialoguri educaționale sau podcasturi cu mai mulți vorbitori. Poți chiar folosi voci multilingve pentru a comuta între limbi, menținând consistența personajului.
Vocile PRO oferă o calitate și o naturalețe superioare comparativ cu vocile regulate. Ele au, de obicei, o expresivitate emoțională mai bună, o pronunție mai precisă și unele suportă funcții avansate precum graficele de intonație. Pentru proiecte profesionale precum cărți audio, cursuri sau prezentări de afaceri, vocile PRO sunt recomandate.
Depinde de setările pe care le modifici. Ajustarea vitezei vorbirii sau a tonului necesită regenerare completă și va consuma limitele tale de caractere, deoarece aceste modificări afectează întreaga sinteză vocală. Totuși, poți modifica liber pauzele dintre propoziții și paragrafe fără niciun consum de limită. În plus, SpeechGen folosește cache inteligent: dacă generezi un text lung, apoi editezi doar o propoziție și regenerezi, sistemul te va taxa doar pentru acea singură propoziție modificată, nu pentru întregul text. Acest sistem de cache îți salvează propozițiile neschimbate timp de 7 zile, făcând editarea iterativă foarte economică.
Obține ajutor de la comunitatea noastră! Pune-ți întrebările în chat-ul nostru de Telegram: https://t.me/speechgen