Kuinka käyttää Teksti puheeksi -toimintoa SpeechGen.io:ssa: Kattava opas

08-09-2025 , 16-09-2025

🚀 Pikakäynnistys — Luo ääntä 4 vaiheessa

Vaihe 1: Valitse kieli

Avaa kielivalikko ja valitse tekstisi kieli. Tuetut kielet: Yli 150 kieltä (tekoälyäänikirjasto).

Vaihe 2: Valitse ääni

Kielen valinnan jälkeen ilmestyy ääniluettelo. Kuuntele näytteitä ja valitse suosikkisi

Vaihe 3: Liitä teksti

Kopioi tekstisi tekstikenttään tai lataa tiedosto (DOCX, PDF). Muuntaaksesi tekstityksiä puheeksi, käytä erillistä SRT-teksti puheeksi -sivua.

Vaihe 4: Napsauta "Luo puhe" (sininen painike)

Vaihe 4: Napsauta Luo puhe

Odota käsittelyä ja lataa valmis äänitiedostosi

Siinä kaikki! Ensimmäinen selostuksesi on valmis vain muutamassa minuutissa.

Tekstin valmistelu

Suositeltu:

Käytä tavallista tekstiä ilman tarpeettomia merkkejä
Aseta välimerkit oikein (pisteet, pilkut, huutomerkit)
Jaa pitkä teksti kappaleisiin

Vältä:

Emojit ja hymiöt (voivat häiritä äänen luontia)
Eksoottiset merkit: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
Erityiset Unicode-merkit:

💡 Vinkki: Kun kopioit PDF-tiedostoista, kiinnitä erityistä huomiota tekstiin — näkymättömiä merkkejä voi ilmestyä, jotka pilaavat äänen!

Rajoitukset

Tuetut kielet: 150+ kieltä (täydellinen luettelo).
Latausmuodot: tavallinen teksti, DOCX, PDF, SRT.

Maksimi per luonti: 2 000 000 merkkiä (≈ 285 000-330 000 sanaa) - tämä on vaikuttava määrä tekstiä, jonka voit muuntaa puheeksi yhdessä luonnissa, mikä tekee siitä ihanteellisen pitkän sisällön, kuten kokonaisten kirjojen tai laajan dokumentaation luomiseen.

Yksityiskohtaiset vaiheittaiset ohjeet

Vaihe 1: Lataa teksti

Liitä teksti: Kopioi tekstisi tekstikenttään
Lataa tiedosto: Tai napsauta latauspainiketta ja valitse tiedosto (DOCX, PDF)
Tarkista teksti: Varmista, että teksti näkyy oikein

Vaihe 2: Valitse kieli

⚠️ Tärkeää: Valitse ensin tekstillesi oikea kieli

Avaa kielivalikko
Etsi tarvitsemasi kieli (yli 150 kieltä saatavilla)
Monikielisille teksteille käytä moniäänistä puheen luontia

Vaihe 3: Valitse ääni

Kielen valinnan jälkeen avautuu luettelo käytettävissä olevista äänistä. Kuuntele näytteitä napsauttamalla kunkin äänen toistopainiketta löytääksesi tarpeisiisi parhaiten sopivan. Näet erilaisia äänityyppejä: Tavalliset äänet tarjoavat standardilaatua, PRO-äänet parannettua laatua ja luonnollisuutta, ja Monikieliset äänet (merkitty kielikoodeilla kuten Ava_US, Ava_ES) antavat sinun säilyttää äänien yhtenäisyyden eri kielten välillä. Käytä aikaa jokaisen äänen esikatseluun, sillä ne vaihtelevat merkittävästi sävyltään, tunteeltaan ja luonteeltaan.

Vaihe 4: Määritä asetukset

Puheen nopeus: x0.1 (erittäin hidas) - x2.2 (erittäin nopea)
Äänen korkeus: -20 - +20 (askel 2)

Tekstikentän alapuolella, luontipainikkeen yläpuolella, voit säätää taukoasetuksia:

taukoasetukset

Tauot lauseiden välillä: 150ms - 30 sekuntia
Tauot kappaleiden välillä: 150ms - 30 sekuntia

Vaihe 5: Luo puhe

Napsauta tekstikentän alla olevaa "Luo puhe" -painiketta aloittaaksesi muunnosprosessin. Käsittelyaika riippuu tekstisi pituudesta - lyhyemmät tekstit valmistuvat sekunneissa, kun taas pidemmät dokumentit voivat kestää muutaman minuutin. Kun luonti on valmis, voit kuunnella tulosta suoraan selaimessa varmistaaksesi, että se vastaa odotuksiasi.

Vaihe 6: Lataa

Kun luonti on valmis, ilmestyy "Lataa" -painike. Oletuksena voit ladata tiedoston MP3-muodossa. Jos kuitenkin tarvitset eri muotoa (WAV tai OPUS) tai haluat muuttaa äänenlaatua (näytteenottotaajuus 8000 - 44000 Hz), sinun on ensin valittava nämä asetukset pudotusvalikoista, luotava puhe uudelleen valituilla asetuksilla ja ladattava sitten tiedosto haluamillasi määrityksillä.

Ääniasetukset

Puheen nopeus

Nopeusasteikko:

x0.1 - x0.9: Hidastus (monimutkaiselle materiaalille, kielten oppimiseen)
x1.0: Normaali nopeus (oletus)
x1.1 - x2.2: Nopeutus (dynaamiselle sisällölle)

Miksi tämä asteikko: Alle 1:n murto-osat hidastavat puhetta, yli 1:n nopeuttavat. Tämä mahdollistaa tarkan tempon valinnan yleisöllesi.

Nopeussuositukset:

Koulutus: x0.8-x1.0 (parempaan ymmärrykseen)
Esitykset: x0.9-x1.1 (virallinen tahti)
Podcastit: x1.0-x1.2 (elinvoimainen tahti)
YouTube: x1.1-x1.4 (huomion ylläpito)

Äänen korkeus

Korkeusalue: -20 - +20, askel 2

Miksi askel 2: 2 yksikön askel tarjoaa havaittavan, mutta ei terävän korkeuden muutoksen. Pienemmät askeleet olisivat huomaamattomia, suuremmat liian dramaattisia.

Korkeuden vaikutus:

Negatiiviset arvot (-2 - -20): Tekevät äänestä matalamman, vakavamman, auktoriteettisemman
Positiiviset arvot (+2 - +20): Tekevät äänestä korkeamman, ystävällisemmän, energisemmän
0: Neutraali korkeus (oletus)

Käyttötarkoitukset:

Liiketoimintasisältö: -4 - +2
Lasten sisältö: +4 - +12
Dramaattinen sisältö: -8 - -16
Ystävällinen sisältö: +2 - +8

Taukojen kanssa työskentely

Automaattiset tauot

Tauot lauseiden välillä: 300ms (oletus)

Tauot kappaleiden välillä: 400ms (oletus)

Näitä asetuksia voidaan muuttaa pudotusvalikoista 150ms - 30 sekuntiin.

Manuaalinen tauon lisäys

Käyttöliittymän kautta:

Aseta kohdistin haluttuun paikkaan tekstissä
Napsauta "Tauko" -painiketta valikossa
Merkki .- ilmestyy tekstiin

Tunnisteiden kautta:

Lisää tunniste <break time="200ms"/> tai <break time="2s"/> haluttuun paikkaan

Taukojen säännöt:

Maksimi tauko: 30 sekuntia
Voit sijoittaa useita taukoja peräkkäin pidemmän viiveen saavuttamiseksi
Tauot eivät kuluta lisärajoituksia

Milloin käyttää taukoja:

Ennen tärkeitä lausuntoja
Retoristen kysymysten jälkeen
Eri aiheiden välillä
Dramaattisen vaikutelman luomiseksi

Moniääninen ääni

Dialogitoiminto mahdollistaa eri äänien käytön yhdessä tekstissä.

Käyttötarkoitukset:

Äänikirjat: Eri äänet hahmoille
Opetusdialogit: Opettaja ja oppilas
Esitykset: Pääpuhuja ja kommentaattori
Podcastit: Useita juontajia

Moniääninen dialogiominaisuus avaa luovia mahdollisuuksia enemmän kuin vain hahmoäänien luomiseen. Esimerkiksi kieltenopettajat voivat käyttää tätä toimintoa demonstroidakseen samaa fraasia eri nopeuksilla kielten oppimista varten, auttaen oppilaita ymmärtämään ääntämistä eri ymmärrystasoilla. Yksityiskohtaisia tekniikoita ja luokkahuonekäyttöä varten katso oppaamme teksti puheeksi -toiminnon käytöstä kieltenopetuksessa.

Äänen valinta

Monikieliset äänet

Kielikoodeilla varustetut äänet (esim. Ava_US, Ava_ES, Ava_DE) on suunniteltu säilyttämään yhtenäinen äänentunnistus eri kielten välillä. Nämä monikieliset äänet mahdollistavat yhtenäisen tyylin luomisen monikieliselle sisällölle, varmistaen että sama äänihahmo voi puhua useita kieliä saumattomasti. Tämä ominaisuus on erityisen hyödyllinen dialogitilassa, jossa voit vaihtaa kieliä säilyttäen saman tunnistettavan äänipersoonallisuuden koko ääniprojektisi ajan.

Äänen segmentointi

SpeechGen mahdollistaa äänitiedostosi jakamisen useisiin segmentteihin yhden synteesiprojektin sisällä, mikä tekee siitä täydellisen videonmuokkaajille, jotka tarvitsevat erillisiä äänitiedostoja eri kohtauksille tai luvuille. Tämä ominaisuus on erityisen hyödyllinen YouTube-videoiden, verkkokurssien tai minkä tahansa tarkan äänen synkronointia vaativan projektin selostusten luomisessa.

Kuinka luoda segmenttejä

Jakaaksesi äänen, aseta kohdistin kohtaan, jossa haluat jakaa tekstin, ja napsauta leikkauspainiketta valikopaneelissa. Tämä lisää <cut/> tunnisteen kyseiseen kohtaan. Voit myös kirjoittaa tai kopioida ja liittää tämän tunnisteen manuaalisesti koko tekstiisi. Mukautettuja tiedostonimiä varten käytä tätä muotoa:

<cut name="oma-tiedostonimi"/>

Tämä ominaisuus auttaa sinua järjestämään segmentit merkityksellisillä nimillä, kuten:

<cut name="intro"/>

<cut name="luku-1"/>

Segmenttien lataaminen ja hallinta

Kun olet lisännyt vähintään yhden segmenttitunnisteen, "lataa segmentit" -painike ilmestyy luonnin jälkeen. Napsauta sitä ladataksesi kaikki segmentit kerralla, tai käytä "lisää" -painiketta äänisoittimessa päästäksesi yksittäisiin segmentteihin. Jokainen tiedosto nimetään automaattisesti yksilöllisellä tunnuksella, sarjanumerolla ja kuvaavalla otsikolla (esim. "7054789_1_ensimmäinen-lause"), mikä helpottaa äänitiedostojesi tunnistamista ja järjestämistä muokkausohjelmassasi.

Segmenttirajoitukset

Lyhyet segmentit: Jopa 1000 segmenttiä per luonti
Pitkät segmentit: Jopa 500 segmenttiä per luonti

Suurempia projekteja varten jaa ne useisiin luonteihin. Kattavat ohjeet, edistyneet tekniikat ja videotutoriaalit löydät täydellisestä äänen segmentointidokumentaatiostamme.

Intonaation asetus

Joissakin äänissä on intonaatiokaavioita:

Intonaatiokaavioita on saatavilla äänissä, joissa näkyy asetukset -kuvake ääninimen vieressä - tämä ominaisuus löytyy yli puolesta kirjaston äänistä, mukaan lukien sekä tavalliset että PRO-vaihtoehdot

Vedä pisteitä kaaviossa muuttaaksesi intonaatiota
Nosta pisteitä lisätäksesi korkeutta tietyissä sanoissa
Laske pisteitä luodaksesi vakavamman sävyn
Kokeile erilaisia käyriä luonnollisuuden saavuttamiseksi

Vedä pisteitä kaaviossa muuttaaksesi intonaatiota

Valitse lause, jonka intonaatiota haluat säätää, ja paina intonaatio -painiketta. Tämä käyttöliittymä ilmestyy.

Välimuistijärjestelmä ja rajoitusten säästö

Älykäs välimuisti

SpeechGen käyttää älykästä välimuistijärjestelmää, joka säästää merkittävästi rajoituksiasi. Järjestelmä tallentaa jokaisen lauseen (jopa 100 000 merkkiä) välimuistiin 7 päiväksi. Kun luot äänen uudelleen, kaikki muuttumattomat lauseet haetaan automaattisesti välimuistista ilmaiseksi - maksat vain uusista tai muokatuista lauseista. Tämä tarkoittaa, että voit tehdä asteittaisia muokkauksia tekstiisi kuluttamatta koko merkki sallittua joka kerta. Projektihistoria tallennetaan 30 päiväksi, ja suosikkeihisi lisäämäsi tiedostot säilyvät pysyvästi.

Tallennusajat:

Lausevälimuisti: 7 päivää
Projektihistoria: 30 päivää
Suosikkitiedostot: Tallennetaan pysyvästi

Yleisten ongelmien vianmääritys

Äänenlaatuongelmat

Ääni kuulostaa epäluonnolliselta:

Kokeile PRO-ääniä
Vähennä nopeutta arvoon x0.9-x1.1
Tarkista välimerkkien oikeellisuus
Käytä neutraalia korkeutta (0)

Virheellinen ääntäminen:

Varmista, että oikea kieli on valittu
Kirjoita monimutkaiset sanat foneettisesti
Käytä SSML-tunnisteita tarkan hallinnan saavuttamiseksi

Epäluonnolliset tauot:

Tarkista välimerkit
Määritä tauot lauseiden välillä
Käytä manuaalisia taukoja .- tai <break time=""/>
Poista ylimääräiset välilyönnit ja rivinvaihdot

SSML-virheet:

Tarkista tunnisteiden oikeellisuus
Kaikki äänet eivät tue kaikkia SSML-tunnisteita

Lisäominaisuudet

SSML (Speech Synthesis Markup Language)

Asiantuntevaa äänenhallintaa varten käytä SSML-tunnisteita:

<break time="2s"/> — tauot
<emphasis level="strong"> — äänen korostus
<prosody rate="slow" pitch="low"> — puheen ominaisuuksien muutos

⚠️ Huomio: Eri äänet tukevat eri SSML-tunnisteita. Testaa toiminnallisuus jokaiselle äänelle.

Historia ja suosikit

Projektihistoria: Tallennetaan automaattisesti 30 päiväksi
Suosikit: Lisää tärkeät projektit pysyvää säilytystä varten

Integraatio ja API

API on saatavilla kehittäjille integroidakseen SpeechGen.io omiin sovelluksiinsa ja palveluihinsa.

Tiedostoni ei lataudu SpeechGen-palveluun. Mitä minun pitäisi tehdä?

Tarkista ensin, että tiedostosi on tuetussa muodossa (DOCX, PDF tai TXT). Varmista, että tiedosto ei ole vioittunut ja yritä ladata se uudelleen. Jos ongelma jatkuu, kopioi teksti manuaalisesti ja liitä se suoraan tekstikenttään. Tarkista myös, ettei tiedostokokosi ylitä alustan rajoituksia.

Kuinka kauan SpeechGen säilyttää luodut äänitiedostoni?

Projektihistoriasi tallennetaan automaattisesti 30 päiväksi. Älykäs välimuisti (lausekohtaiset säästöt) kestää 7 päivää. Jos haluat säilyttää tiedostot pysyvästi, lisää ne suosikkeihisi. Tämä varmistaa, että tärkeät ääniprojektisi eivät koskaan katoa ja pysyvät saatavilla profiilissasi.

Voinko käyttää eri ääniä eri hahmoille yhdessä äänitiedostossa?

Kyllä! SpeechGen tarjoaa moniäänistä puheen luontia (dialogitila). Voit määrittää eri ääniä eri tekstiosioihin, mikä tekee siitä täydellisen äänikirjoille, joissa on useita hahmoja, opetusdialogeihin tai podcasteihin, joissa on useita puhujia. Voit jopa käyttää monikielisiä ääniä vaihtaaksesi kieliä säilyttäen samalla hahmon yhtenäisyyden.

Mikä on ero tavallisten ja PRO-äänien välillä SpeechGenissä?

PRO-äänet tarjoavat paremman laadun ja luonnollisuuden verrattuna tavallisiin ääniin. Niillä on yleensä parempi tunneilmaisu, tarkempi ääntäminen ja jotkut tukevat edistyneitä ominaisuuksia, kuten intonaatiokaavioita. Ammattimaisiin projekteihin, kuten äänikirjoihin, kursseihin tai yritysesityksiin, PRO-äänet ovat suositeltavia.

Kuluttaako ääniasetusten muuttaminen merkki-rajoituksiani?

Se riippuu siitä, mitä asetuksia muutat. Puheen nopeuden tai korkeuden säätäminen vaatii täydellisen uudelleenluonnin ja kuluttaa merkki-rajoituksiasi, koska nämä muutokset vaikuttavat koko puhesynteesiin. Voit kuitenkin vapaasti muokata lauseiden ja kappaleiden välisiä taukoja ilman rajoitusten kulutusta. Lisäksi SpeechGen käyttää älykästä välimuistia: jos luot suuren tekstin, muokkaat sitten vain yhtä lausetta ja luot uudelleen, järjestelmä veloittaa sinulta vain kyseisen muuttuneen lauseen, ei koko tekstiä. Tämä välimuistijärjestelmä säästää muuttumattomat lauseesi 7 päivän ajan, mikä tekee iteratiivisesta muokkaamisesta erittäin taloudellista.

Video

Onko sinulla vielä kysyttävää?

Hanki apua yhteisöltämme! Kysy kysymyksiäsi Telegram-chatissamme: https://t.me/speechgen