08-09-2025 , 16-09-2025
Atidarykite kalbos išskleidžiamąjį meniu ir pasirinkite savo teksto kalbą. Palaikomos kalbos: Daugiau nei 150 kalbų (dirbtinio intelekto balsų biblioteka).
Pasirinkę kalbą, pasirodys balsų sąrašas. Klausykitės pavyzdžių ir pasirinkite savo mėgstamiausią.
Nukopijuokite tekstą į teksto laukelį arba įkelkite failą (DOCX, PDF). Norėdami konvertuoti subtitrus į kalbą, naudokite specialų puslapį SRT į balsą.
Palaukite apdorojimo ir atsisiųskite paruoštą garso failą.
Štai ir viskas! Jūsų pirmasis balsas paruoštas vos per kelias minutes.
💡 Patarimas: Kopijuodami iš PDF failų, atkreipkite ypatingą dėmesį į tekstą – gali atsirasti nematomi simboliai, kurie sugadins garsą!
Didžiausias kiekis vienai generacijai: 2 000 000 simbolių (≈ 285 000–330 000 žodžių) – tai įspūdingas teksto kiekis, kurį galite konvertuoti į kalbą vienos generacijos metu, todėl jis idealiai tinka ilgiems turiniams, tokiems kaip visos knygos ar išsami dokumentacija.
⚠️ Svarbu: Pirmiausia pasirinkite tinkamą savo teksto kalbą.
Pasirinkus kalbą, atsiras turimų balsų sąrašas. Klausykitės pavyzdžių spustelėdami atkūrimo mygtuką kiekvienam balsui, kad rastumėte tinkamiausią. Galėsite rinktis skirtingus balso tipus: įprasti balsai siūlo standartinę kokybę, PRO balsai – pagerintą kokybę ir natūralumą, o kelių kalbų balsai (pažymėti kalbos kodais, pvz., Ava_US, Ava_ES) leidžia išlaikyti balso nuoseklumą skirtingose kalbose. Skirkite laiko kiekvieno balso peržiūrai, nes jie skiriasi tonu, emocijomis ir charakteriu.
Po teksto laukeliu, prieš generavimo mygtuką, galite reguliuoti pauzių nustatymus:
Spustelėkite mygtuką „Generuoti kalbą“ po teksto laukeliu, kad pradėtumėte konvertavimo procesą. Apdorojimo laikas priklauso nuo jūsų teksto ilgio – trumpesni tekstai apdorojami per kelias sekundes, o ilgesni dokumentai gali užtrukti kelias minutes. Kai generavimas bus baigtas, galėsite tiesiogiai naršyklėje klausytis rezultato, kad įsitikintumėte, jog jis atitinka jūsų lūkesčius.
Baigus generavimą, pasirodys mygtukas „Atsisiųsti“. Pagal numatytuosius nustatymus galite tiesiog atsisiųsti failą kaip MP3. Tačiau, jei jums reikia kito formato (WAV arba OPUS) arba norite pakeisti garso kokybę (dažnių santykis nuo 8000 iki 44000 Hz), pirmiausia turėsite pasirinkti šias parinktis išskleidžiamuosiuose meniu, pakartotinai generuoti kalbą su pasirinktais nustatymais, o tada atsisiųsti failą su pageidaujamomis specifikacijomis.
Greičio skalė:
Kodėl tokia skalė: Dalinės reikšmės mažesnės nei 1 sulėtina kalbą, didesnės nei 1 – pagreitina. Tai leidžia tiksliai pasirinkti tempą savo auditorijai.
Greičio rekomendacijos:
Tono diapazonas: nuo -20 iki +20 su 2 žingsniu.
Kodėl 2 žingsnis: 2 vienetų žingsnis suteikia pastebimą, bet ne staigų tono pokytį. Mažesni žingsniai būtų nepastebimi, didesni – per daug dramatiški.
Tono įtaka:
Naudojimo atvejai:
Pauzes tarp sakinių: 300ms (numatytasis).
Pauzes tarp pastraipų: 400ms (numatytasis).
Šiuos nustatymus galima keisti išskleidžiamuosiuose meniu nuo 150ms iki 30 sekundžių.
Per sąsają:
Per žymas:
Įterpkite žymą <break time="200ms"/> arba <break time="2s"/> norimoje vietoje.
Pauzių taisyklės:
Kada naudoti pauzes:
Funkcija dialogui leidžia naudoti skirtingus balsus viename tekste.
Kelių balsų dialogo funkcija atveria kūrybines galimybes, neapsiribojant tik personažų balsais. Pavyzdžiui, užsienio kalbų mokytojai gali naudoti šią funkciją, kad demonstruotų tą pačią frazę skirtingais greičiais mokymosi tikslais, padėdami studentams suprasti tarimą skirtingais suvokimo lygiais. Norėdami gauti išsamių metodų ir pamokų, peržiūrėkite mūsų vadovą teksto į kalbą naudojimas mokant užsienio kalbų.
Balsai su kalbos kodais (pvz., Ava_US, Ava_ES, Ava_DE) yra sukurti taip, kad išlaikytų nuoseklų balso atpažinimą skirtingose kalbose. Šie kelių kalbų balsai leidžia sukurti vieningą stilių daugialypiam turiniui, užtikrinant, kad tas pats balso personažas galėtų sklandžiai kalbėti keliomis kalbomis. Ši funkcija ypač naudinga dialogo režimu, kai galite perjungti kalbas, išlaikydami tą pačią atpažįstamą balso asmenybę visame garso projekte.
„SpeechGen“ leidžia suskirstyti sugeneruotą garsą į kelis segmentus viename sintezės projekte, todėl jis puikiai tinka vaizdo redaktoriams, kuriems reikia atskirų garso failų skirtingoms scenoms ar skyriams. Ši funkcija ypač naudinga kuriant „YouTube“ vaizdo įrašų, internetinių kursų ar bet kokių projektų, kuriems reikalingas tikslus garso sinchronizavimas, balsus.
Norėdami suskirstyti garsą, tiesiog pastatykite žymeklį ten, kur norite padalinti tekstą, ir spustelėkite pjovimo mygtuką meniu skydelyje. Tai įterps <cut/> žymą toje vietoje. Taip pat galite rankiniu būdu įvesti arba nukopijuoti ir įklijuoti šią žymą visame tekste. Norėdami nustatyti pasirinktinius failų pavadinimus, naudokite šį formatą:
<cut name="jūsų-failo-pavadinimas"/>
Ši funkcija padeda organizuoti segmentus su prasmingais pavadinimais, pvz.:
<cut name="intro"/>
<cut name="chapter-1"/>
Įvedę bent vieną segmentų žymą, po generavimo pasirodys mygtukas „atsisiųsti segmentus“. Spustelėkite jį, kad atsisiųstumėte visus segmentus vienu metu, arba naudokite garso grotuvo mygtuką „daugiau“, kad pasiektumėte atskirus segmentus. Kiekvienas failas automatiškai pavadinamas unikaliu ID, sekos numeriu ir aprašomuoju pavadinimu (pvz., „7054789_1_first-sentence“), todėl juos lengva atpažinti ir tvarkyti garso failus redagavimo programinėje įrangoje.
Didesniems projektams suskirstykite į kelias generacijas. Išsamioms instrukcijoms, pažangiems metodams ir vaizdo įrašų vadovams apsilankykite mūsų visiško garso segmentavimo dokumentacijoje.
Kai kurie balsai turi intonacijos grafikus:
Intonacijos grafikai pasiekiami balsams, kurie šalia balso pavadinimo rodo nustatymų piktogramą – ši funkcija yra daugiau nei pusėje bibliotekos balsų, įskaitant tiek įprastus, tiek PRO variantus.
Pasirinkite sakinį, kuriame norite koreguoti intonaciją, ir paspauskite intonacijos mygtuką. Atsiras ši sąsaja.
„SpeechGen“ naudoja išmaniąją talpyklos sistemą, kuri žymiai taupo jūsų limitus. Sistema veikia išsaugodama kiekvieną sakinį (iki 100 000 simbolių) talpykloje 7 dienas. Kai pakartotinai generuojate garsą, visi nepakeisti sakiniai automatiškai nemokamai gaunami iš talpyklos – mokate tik už naujus ar redaguotus sakinius. Tai reiškia, kad galite laipsniškai redaguoti savo tekstą, nešvaistydami visos simbolių kvotos kiekvieną kartą. Projektų istorija saugoma 30 dienų, o failai, kuriuos pridedate prie mėgstamiausių, saugomi nuolat.
Saugojimo laikotarpiai:
Balsas skamba nenatūraliai:
Netinkamas tarimas:
Nenatūralios pauzės:
SSML klaidos:
Norėdami ekspertų balso valdymo, naudokite SSML žymas:
⚠️ Dėmesio: Skirtingi balsai palaiko skirtingus SSML žymų rinkinius. Išbandykite funkcionalumą kiekvienam konkrečiam balsui.
API yra prieinama kūrėjams, norintiems integruoti „SpeechGen.io“ į savo programas ir paslaugas.
Pirmiausia patikrinkite, ar jūsų failas yra palaikomu formatu (DOCX, PDF arba TXT). Įsitikinkite, kad failas nėra sugadintas, ir pabandykite įkelti dar kartą. Jei problema išlieka, nukopijuokite tekstą rankiniu būdu ir įklijuokite jį tiesiai į teksto laukelį. Taip pat patikrinkite, ar jūsų failo dydis neviršija platformos apribojimų.
Jūsų projektų istorija automatiškai saugoma 30 dienų. Išmanioji talpykla (sakinio lygio taupymui) veikia 7 dienas. Norėdami išsaugoti failus nuolat, pridėkite juos prie mėgstamiausių. Tai užtikrina, kad jūsų svarbūs garso projektai niekada nebus pamesti ir liks pasiekiami jūsų profilyje.
Taip! „SpeechGen“ siūlo kelių balsų garso generavimą (dialogo režimu). Galite priskirti skirtingus balsus skirtingoms teksto dalims, todėl tai puikiai tinka audio knygoms su keliais personažais, švietimo dialogams ar podcastams su keliais vedėjais. Galite netgi naudoti kelių kalbų balsus, kad perjungtumėte kalbas, išlaikydami personažų nuoseklumą.
Tai priklauso nuo to, kuriuos nustatymus keičiate. Keičiant kalbėjimo greitį ar toną, reikalingas pilnas pakartotinis generavimas ir tai sunaudos jūsų simbolių limitus, nes šie pakeitimai paveikia visą kalbos sintezę. Tačiau galite laisvai keisti pauzes tarp sakinių ir pastraipų be jokio limito suvartojimo. Be to, „SpeechGen“ naudoja išmaniąją talpyklą: jei generuojate ilgą tekstą, tada redaguojate tik vieną sakinį ir pakartotinai generuojate, sistema apmokestins tik tą vieną pakeistą sakinį, o ne visą tekstą. Ši talpyklos sistema saugo nepakeistus sakinius 7 dienas, todėl laipsniškas redagavimas yra labai ekonomiškas.
Gaukite pagalbos iš mūsų bendruomenės! Užduokite savo klausimus mūsų „Telegram“ pokalbių grupėje: https://t.me/speechgen