08-09-2025 , 16-09-2025
Avaa kielivalikko ja valitse tekstisi kieli. Tuetut kielet: Yli 150 kieltä (tekoälyäänikirjasto).
Kielen valinnan jälkeen ilmestyy ääniluettelo. Kuuntele näytteitä ja valitse suosikkisi
Kopioi tekstisi tekstikenttään tai lataa tiedosto (DOCX, PDF). Muuntaaksesi tekstityksiä puheeksi, käytä erillistä SRT-teksti puheeksi -sivua.
Odota käsittelyä ja lataa valmis äänitiedostosi
Siinä kaikki! Ensimmäinen selostuksesi on valmis vain muutamassa minuutissa.
💡 Vinkki: Kun kopioit PDF-tiedostoista, kiinnitä erityistä huomiota tekstiin — näkymättömiä merkkejä voi ilmestyä, jotka pilaavat äänen!
Maksimi per luonti: 2 000 000 merkkiä (≈ 285 000-330 000 sanaa) - tämä on vaikuttava määrä tekstiä, jonka voit muuntaa puheeksi yhdessä luonnissa, mikä tekee siitä ihanteellisen pitkän sisällön, kuten kokonaisten kirjojen tai laajan dokumentaation luomiseen.
⚠️ Tärkeää: Valitse ensin tekstillesi oikea kieli
Kielen valinnan jälkeen avautuu luettelo käytettävissä olevista äänistä. Kuuntele näytteitä napsauttamalla kunkin äänen toistopainiketta löytääksesi tarpeisiisi parhaiten sopivan. Näet erilaisia äänityyppejä: Tavalliset äänet tarjoavat standardilaatua, PRO-äänet parannettua laatua ja luonnollisuutta, ja Monikieliset äänet (merkitty kielikoodeilla kuten Ava_US, Ava_ES) antavat sinun säilyttää äänien yhtenäisyyden eri kielten välillä. Käytä aikaa jokaisen äänen esikatseluun, sillä ne vaihtelevat merkittävästi sävyltään, tunteeltaan ja luonteeltaan.
Tekstikentän alapuolella, luontipainikkeen yläpuolella, voit säätää taukoasetuksia:
Napsauta tekstikentän alla olevaa "Luo puhe" -painiketta aloittaaksesi muunnosprosessin. Käsittelyaika riippuu tekstisi pituudesta - lyhyemmät tekstit valmistuvat sekunneissa, kun taas pidemmät dokumentit voivat kestää muutaman minuutin. Kun luonti on valmis, voit kuunnella tulosta suoraan selaimessa varmistaaksesi, että se vastaa odotuksiasi.
Kun luonti on valmis, ilmestyy "Lataa" -painike. Oletuksena voit ladata tiedoston MP3-muodossa. Jos kuitenkin tarvitset eri muotoa (WAV tai OPUS) tai haluat muuttaa äänenlaatua (näytteenottotaajuus 8000 - 44000 Hz), sinun on ensin valittava nämä asetukset pudotusvalikoista, luotava puhe uudelleen valituilla asetuksilla ja ladattava sitten tiedosto haluamillasi määrityksillä.
Nopeusasteikko:
Miksi tämä asteikko: Alle 1:n murto-osat hidastavat puhetta, yli 1:n nopeuttavat. Tämä mahdollistaa tarkan tempon valinnan yleisöllesi.
Nopeussuositukset:
Korkeusalue: -20 - +20, askel 2
Miksi askel 2: 2 yksikön askel tarjoaa havaittavan, mutta ei terävän korkeuden muutoksen. Pienemmät askeleet olisivat huomaamattomia, suuremmat liian dramaattisia.
Korkeuden vaikutus:
Käyttötarkoitukset:
Tauot lauseiden välillä: 300ms (oletus)
Tauot kappaleiden välillä: 400ms (oletus)
Näitä asetuksia voidaan muuttaa pudotusvalikoista 150ms - 30 sekuntiin.
Käyttöliittymän kautta:
Tunnisteiden kautta:
Lisää tunniste <break time="200ms"/> tai <break time="2s"/> haluttuun paikkaan
Taukojen säännöt:
Milloin käyttää taukoja:
Dialogitoiminto mahdollistaa eri äänien käytön yhdessä tekstissä.
Moniääninen dialogiominaisuus avaa luovia mahdollisuuksia enemmän kuin vain hahmoäänien luomiseen. Esimerkiksi kieltenopettajat voivat käyttää tätä toimintoa demonstroidakseen samaa fraasia eri nopeuksilla kielten oppimista varten, auttaen oppilaita ymmärtämään ääntämistä eri ymmärrystasoilla. Yksityiskohtaisia tekniikoita ja luokkahuonekäyttöä varten katso oppaamme teksti puheeksi -toiminnon käytöstä kieltenopetuksessa.
Kielikoodeilla varustetut äänet (esim. Ava_US, Ava_ES, Ava_DE) on suunniteltu säilyttämään yhtenäinen äänentunnistus eri kielten välillä. Nämä monikieliset äänet mahdollistavat yhtenäisen tyylin luomisen monikieliselle sisällölle, varmistaen että sama äänihahmo voi puhua useita kieliä saumattomasti. Tämä ominaisuus on erityisen hyödyllinen dialogitilassa, jossa voit vaihtaa kieliä säilyttäen saman tunnistettavan äänipersoonallisuuden koko ääniprojektisi ajan.
SpeechGen mahdollistaa äänitiedostosi jakamisen useisiin segmentteihin yhden synteesiprojektin sisällä, mikä tekee siitä täydellisen videonmuokkaajille, jotka tarvitsevat erillisiä äänitiedostoja eri kohtauksille tai luvuille. Tämä ominaisuus on erityisen hyödyllinen YouTube-videoiden, verkkokurssien tai minkä tahansa tarkan äänen synkronointia vaativan projektin selostusten luomisessa.
Jakaaksesi äänen, aseta kohdistin kohtaan, jossa haluat jakaa tekstin, ja napsauta leikkauspainiketta valikopaneelissa. Tämä lisää <cut/> tunnisteen kyseiseen kohtaan. Voit myös kirjoittaa tai kopioida ja liittää tämän tunnisteen manuaalisesti koko tekstiisi. Mukautettuja tiedostonimiä varten käytä tätä muotoa:
<cut name="oma-tiedostonimi"/>
Tämä ominaisuus auttaa sinua järjestämään segmentit merkityksellisillä nimillä, kuten:
<cut name="intro"/>
<cut name="luku-1"/>
Kun olet lisännyt vähintään yhden segmenttitunnisteen, "lataa segmentit" -painike ilmestyy luonnin jälkeen. Napsauta sitä ladataksesi kaikki segmentit kerralla, tai käytä "lisää" -painiketta äänisoittimessa päästäksesi yksittäisiin segmentteihin. Jokainen tiedosto nimetään automaattisesti yksilöllisellä tunnuksella, sarjanumerolla ja kuvaavalla otsikolla (esim. "7054789_1_ensimmäinen-lause"), mikä helpottaa äänitiedostojesi tunnistamista ja järjestämistä muokkausohjelmassasi.
Suurempia projekteja varten jaa ne useisiin luonteihin. Kattavat ohjeet, edistyneet tekniikat ja videotutoriaalit löydät täydellisestä äänen segmentointidokumentaatiostamme.
Joissakin äänissä on intonaatiokaavioita:
Intonaatiokaavioita on saatavilla äänissä, joissa näkyy asetukset -kuvake ääninimen vieressä - tämä ominaisuus löytyy yli puolesta kirjaston äänistä, mukaan lukien sekä tavalliset että PRO-vaihtoehdot
Valitse lause, jonka intonaatiota haluat säätää, ja paina intonaatio -painiketta. Tämä käyttöliittymä ilmestyy.
SpeechGen käyttää älykästä välimuistijärjestelmää, joka säästää merkittävästi rajoituksiasi. Järjestelmä tallentaa jokaisen lauseen (jopa 100 000 merkkiä) välimuistiin 7 päiväksi. Kun luot äänen uudelleen, kaikki muuttumattomat lauseet haetaan automaattisesti välimuistista ilmaiseksi - maksat vain uusista tai muokatuista lauseista. Tämä tarkoittaa, että voit tehdä asteittaisia muokkauksia tekstiisi kuluttamatta koko merkki sallittua joka kerta. Projektihistoria tallennetaan 30 päiväksi, ja suosikkeihisi lisäämäsi tiedostot säilyvät pysyvästi.
Tallennusajat:
Ääni kuulostaa epäluonnolliselta:
Virheellinen ääntäminen:
Epäluonnolliset tauot:
SSML-virheet:
Asiantuntevaa äänenhallintaa varten käytä SSML-tunnisteita:
⚠️ Huomio: Eri äänet tukevat eri SSML-tunnisteita. Testaa toiminnallisuus jokaiselle äänelle.
API on saatavilla kehittäjille integroidakseen SpeechGen.io omiin sovelluksiinsa ja palveluihinsa.
Tarkista ensin, että tiedostosi on tuetussa muodossa (DOCX, PDF tai TXT). Varmista, että tiedosto ei ole vioittunut ja yritä ladata se uudelleen. Jos ongelma jatkuu, kopioi teksti manuaalisesti ja liitä se suoraan tekstikenttään. Tarkista myös, ettei tiedostokokosi ylitä alustan rajoituksia.
Projektihistoriasi tallennetaan automaattisesti 30 päiväksi. Älykäs välimuisti (lausekohtaiset säästöt) kestää 7 päivää. Jos haluat säilyttää tiedostot pysyvästi, lisää ne suosikkeihisi. Tämä varmistaa, että tärkeät ääniprojektisi eivät koskaan katoa ja pysyvät saatavilla profiilissasi.
Kyllä! SpeechGen tarjoaa moniäänistä puheen luontia (dialogitila). Voit määrittää eri ääniä eri tekstiosioihin, mikä tekee siitä täydellisen äänikirjoille, joissa on useita hahmoja, opetusdialogeihin tai podcasteihin, joissa on useita puhujia. Voit jopa käyttää monikielisiä ääniä vaihtaaksesi kieliä säilyttäen samalla hahmon yhtenäisyyden.
PRO-äänet tarjoavat paremman laadun ja luonnollisuuden verrattuna tavallisiin ääniin. Niillä on yleensä parempi tunneilmaisu, tarkempi ääntäminen ja jotkut tukevat edistyneitä ominaisuuksia, kuten intonaatiokaavioita. Ammattimaisiin projekteihin, kuten äänikirjoihin, kursseihin tai yritysesityksiin, PRO-äänet ovat suositeltavia.
Se riippuu siitä, mitä asetuksia muutat. Puheen nopeuden tai korkeuden säätäminen vaatii täydellisen uudelleenluonnin ja kuluttaa merkki-rajoituksiasi, koska nämä muutokset vaikuttavat koko puhesynteesiin. Voit kuitenkin vapaasti muokata lauseiden ja kappaleiden välisiä taukoja ilman rajoitusten kulutusta. Lisäksi SpeechGen käyttää älykästä välimuistia: jos luot suuren tekstin, muokkaat sitten vain yhtä lausetta ja luot uudelleen, järjestelmä veloittaa sinulta vain kyseisen muuttuneen lauseen, ei koko tekstiä. Tämä välimuistijärjestelmä säästää muuttumattomat lauseesi 7 päivän ajan, mikä tekee iteratiivisesta muokkaamisesta erittäin taloudellista.
Hanki apua yhteisöltämme! Kysy kysymyksiäsi Telegram-chatissamme: https://t.me/speechgen
Kansainvälinen Telegram-chat @speechgen
Henkilökohtainen tuki Telegramissa @speechgen_alex