Hoe gebruik je Tekst naar Spraak op SpeechGen.io: Complete Gids

08-09-2025 , 16-09-2025

🚀 Snel Starten — Audio Maken in 4 Stappen

Stap 1: Taal Selecteren

Open de taal dropdown en kies de taal van je tekst. Ondersteunde talen: Meer dan 150 talen (AI stemmen bibliotheek).

Stap 2: Stem Kiezen

Nadat je de taal hebt gekozen, verschijnt er een lijst met stemmen. Luister naar voorbeelden en kies je favoriet

Stap 3: Tekst Plakken

Kopieer je tekst naar het tekstvak of upload een bestand (DOCX, PDF). Gebruik voor het omzetten van ondertitels naar spraak de speciale SRT naar stem pagina.

Stap 4: Klik op "Genereer Spraak" (blauwe knop)

Stap 4: Klik Genereer Spraak

Wacht op de verwerking en download je kant-en-klare audiobestand

Dat is alles! Je eerste voice-over is in een paar minuten klaar.

Tekst Voorbereiden

Aanbevolen:

Gebruik platte tekst zonder onnodige symbolen
Plaats leestekens correct (punten, komma's, uitroeptekens)
Breek lange teksten op in alinea's

Vermijden:

Emoji's en emoticons (kunnen audio generatie verstoren)
Exotische symbolen: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
Speciale Unicode symbolen:

💡 Tip: Let bij het kopiëren uit PDF-bestanden extra goed op de tekst — er kunnen onzichtbare tekens verschijnen die de audio verpesten!

Limieten en Beperkingen

Ondersteunde talen: 150+ talen (volledige lijst).
Upload formaten: platte tekst, DOCX, PDF, SRT.

Maximaal per generatie: 2.000.000 tekens (≈ 285.000-330.000 woorden) - dit is de indrukwekkende hoeveelheid tekst die je in één generatie naar spraak kunt omzetten, waardoor het ideaal is voor lange content zoals hele boeken of uitgebreide documentatie.

Gedetailleerde Stap-voor-Stap Instructies

Stap 1: Tekst Uploaden

Tekst plakken: Kopieer je tekst naar het tekstvak
Bestand uploaden: Of klik op de uploadknop en selecteer een bestand (DOCX, PDF)
Tekst controleren: Zorg ervoor dat de tekst correct wordt weergegeven

Stap 2: Taal Selecteren

⚠️ Belangrijk: Selecteer eerst de juiste taal voor je tekst

Open de taal dropdown lijst
Zoek de benodigde taal (150+ talen beschikbaar)
Voor teksten in meerdere talen, gebruik meertalige audio generatie

Stap 3: Stem Kiezen

Nadat je de taal hebt gekozen, opent er een lijst met beschikbare stemmen. Luister naar voorbeelden door op de afspeelknop voor elke stem te klikken om degene te vinden die het beste bij je past. Je ziet verschillende stemtypes beschikbaar: Reguliere stemmen bieden standaardkwaliteit, PRO stemmen bieden verbeterde kwaliteit en natuurlijkheid, en Meertalige stemmen (gemarkeerd met taalcodes zoals Ava_US, Ava_ES) stellen je in staat om stemconsistentie te behouden over verschillende talen. Neem de tijd om elke stem te beluisteren, aangezien ze aanzienlijk verschillen in toon, emotie en karakter.

Stap 4: Parameters Instellen

Spraaksnelheid: van x0.1 (erg langzaam) tot x2.2 (erg snel)
Stemtoonhoogte: van -20 tot +20 (stap 2)

Onder het tekstvak, boven de genereerknop, kun je de pauze-instellingen aanpassen:

pauze-instellingen

Pauzes tussen zinnen: 150ms - 30 seconden
Pauzes tussen alinea's: 150ms - 30 seconden

Stap 5: Spraak Genereren

Klik op de knop "Genereer Spraak" onder het tekstvak om het conversieproces te starten. De verwerkingstijd hangt af van de lengte van je tekst - kortere teksten zijn binnen enkele seconden klaar, terwijl langere documenten enkele minuten kunnen duren. Zodra de generatie voltooid is, kun je het resultaat direct in de browser beluisteren om er zeker van te zijn dat het aan je verwachtingen voldoet.

Stap 6: Downloaden

Nadat de generatie is voltooid, verschijnt er een "Download" knop. Standaard kun je het bestand gewoon als MP3 downloaden. Als je echter een ander formaat nodig hebt (WAV of OPUS) of de audiokwaliteit wilt wijzigen (sample rate van 8000 tot 44000 Hz), moet je eerst deze opties selecteren uit de dropdown menu's, de spraak opnieuw genereren met je gekozen instellingen, en vervolgens het bestand downloaden met je voorkeurspecificaties.

Audio Parameter Instellingen

Spraaksnelheid

Snelheidsschaal:

x0.1 - x0.9: Vertragen (voor complexe materie, taal leren)
x1.0: Normale snelheid (standaard)
x1.1 - x2.2: Versnellen (voor dynamische content)

Waarom deze schaal: Fractionele waarden kleiner dan 1 vertragen de spraak, groter dan 1 versnellen deze. Dit maakt een nauwkeurige tempo selectie voor je publiek mogelijk.

Snelheid aanbevelingen:

Onderwijs: x0.8-x1.0 (voor beter begrip)
Presentaties: x0.9-x1.1 (officieel tempo)
Podcasts: x1.0-x1.2 (levendig tempo)
YouTube: x1.1-x1.4 (aandacht vasthouden)

Stemtoonhoogte

Toonhoogte bereik: van -20 tot +20 met stap 2

Waarom stap 2: Een stap van 2 eenheden zorgt voor een merkbare maar niet scherpe toonhoogteverandering. Kleinere stappen zouden niet opvallen, grotere stappen te dramatisch.

Invloed toonhoogte:

Negatieve waarden (-2 tot -20): Maken de stem lager, serieuzer, autoritairder
Positieve waarden (+2 tot +20): Maken de stem hoger, vriendelijker, energieker
0: Neutrale toonhoogte (standaard)

Toepassingen:

Zakelijke content: -4 tot +2
Kindercontent: +4 tot +12
Dramatische content: -8 tot -16
Vriendelijke content: +2 tot +8

Werken met Pauzes

Automatische Pauzes

Pauzes tussen zinnen: 300ms (standaard)

Pauzes tussen alinea's: 400ms (standaard)

Deze instellingen kunnen worden gewijzigd in dropdown menu's van 150ms tot 30 seconden.

Handmatig Pauzes Invoegen

Via interface:

Plaats de cursor op de gewenste plek in de tekst
Klik op de knop "Pauze" in het menu
Het symbool .- verschijnt in de tekst

Via tags:

Voeg de tag <break time="200ms"/> of <break time="2s"/> in op de gewenste locatie

Pauze regels:

Maximale pauze: 30 seconden
Meerdere pauzes achter elkaar plaatsen voor langere vertraging
Pauzes verbruiken geen extra limieten

Wanneer pauzes gebruiken:

Voor belangrijke uitspraken
Na retorische vragen
Tussen verschillende onderwerpen
Om een dramatisch effect te creëren

Meertalige Audio

De dialoogfunctie maakt het mogelijk om verschillende stemmen in één tekst te gebruiken.

Toepassingen:

Audioboeken: Verschillende stemmen voor personages
Educatieve dialogen: Leraar en student
Presentaties: Hoofdspreker en commentator
Podcasts: Meerdere presentatoren

De meertalige dialoogfunctie opent creatieve mogelijkheden die verder gaan dan alleen stemmen van personages. Docenten vreemde talen kunnen deze functie bijvoorbeeld gebruiken om dezelfde zin op verschillende snelheden te demonstreren voor taalonderwijs, waardoor studenten de uitspraak op verschillende begripsniveaus kunnen begrijpen. Voor gedetailleerde technieken en toepassingen in de klas, zie onze gids over het gebruik van tekst-naar-spraak voor het onderwijzen van vreemde talen.

Stem Selectie

Meertalige Stemmen

Stemmen met taalcodes (bijv. Ava_US, Ava_ES, Ava_DE) zijn ontworpen om consistente stemherkenning te behouden over verschillende talen. Deze meertalige stemmen stellen je in staat om een uniforme stijl te creëren voor meertalige content, zodat hetzelfde stemkarakter meerdere talen naadloos kan spreken. Deze functie is bijzonder nuttig in de dialoogmodus, waar je kunt wisselen tussen talen terwijl je dezelfde herkenbare stem persoonlijkheid behoudt gedurende je audioproject.

Audio Segmentatie

SpeechGen stelt je in staat om je gegenereerde audio op te splitsen in meerdere segmenten binnen één syntheseproject, waardoor het perfect is voor video-editors die aparte audiobestanden nodig hebben voor verschillende scènes of hoofdstukken. Deze functie is bijzonder nuttig voor het maken van voice-overs voor YouTube-video's, online cursussen of elk project dat nauwkeurige audiosynchronisatie vereist.

Hoe Segmenten te Maken

Om je audio op te splitsen, plaats je simpelweg je cursor waar je de tekst wilt verdelen en klik je op de knipknop in het menu. Dit voegt een <cut/> tag toe op die positie. Je kunt deze tag ook handmatig typen of kopiëren en plakken door je tekst heen. Voor aangepaste bestandsnamen, gebruik dit formaat:

<cut name="jouw-bestandsnaam"/>

Deze functie helpt je segmenten te organiseren met betekenisvolle namen zoals:

<cut name="intro"/>

<cut name="hoofdstuk-1"/>

Segmenten Downloaden en Beheren

Zodra je ten minste één segment tag hebt toegevoegd, verschijnt er na de generatie een "segmenten downloaden" knop. Klik erop om alle segmenten tegelijk te downloaden, of gebruik de "meer" knop op de audiospeler om toegang te krijgen tot individuele segmenten. Elk bestand wordt automatisch benoemd met een unieke ID, volgnummer en beschrijvende titel (bijv. "7054789_1_eerste-zin"), waardoor het gemakkelijk is om je audiobestanden in je bewerkingssoftware te identificeren en te organiseren.

Segment Limieten

Korte segmenten: Tot 1000 segmenten per generatie
Lange segmenten: Tot 500 segmenten per generatie

Splits voor grotere projecten op in meerdere generaties. Voor uitgebreide instructies, geavanceerde technieken en videotutorials, bezoek onze complete documentatie over audio segmentatie.

Intonatie Instellen

Sommige stemmen hebben intonatie grafieken:

Intonatie grafieken zijn beschikbaar op stemmen die een instellingen icoon tonen naast de stemnaam - deze functie is te vinden op meer dan de helft van de stemmen in de bibliotheek, inclusief zowel reguliere als PRO opties

Sleep punten op de grafiek om de intonatie te veranderen
Verhoog punten om de toonhoogte op bepaalde woorden te verhogen
Verlaag punten om een serieuzere toon te creëren
Experimenteer met verschillende curves voor natuurlijkheid

Sleep punten op de grafiek om de intonatie te veranderen

Selecteer de zin waarin je de intonatie wilt aanpassen en druk op de intonatie knop. Deze interface verschijnt.

Caching Systeem en Limiet Besparing

Slimme Cache

SpeechGen. gebruikt een intelligent cachesysteem dat je limieten aanzienlijk bespaart. Het systeem werkt door elke zin (tot 100.000 tekens) 7 dagen in de cache op te slaan. Wanneer je je audio opnieuw genereert, worden alle ongewijzigde zinnen automatisch gratis uit de cache opgehaald - je betaalt alleen voor nieuwe of bewerkte zinnen. Dit betekent dat je incrementele wijzigingen in je tekst kunt aanbrengen zonder elke keer je volledige tekenlimiet te verbruiken. Projectgeschiedenis wordt 30 dagen opgeslagen en bestanden die je aan favorieten toevoegt, worden permanent bewaard.

Opslagperiodes:

Zin cache: 7 dagen
Projectgeschiedenis: 30 dagen
Favoriete bestanden: Permanent opgeslagen

Problemen Oplossen

Audio Kwaliteit Problemen

Stem klinkt onnatuurlijk:

Probeer PRO stemmen
Verlaag de snelheid naar x0.9-x1.1
Controleer de correctheid van de interpunctie
Gebruik neutrale toonhoogte (0)

Onjuiste uitspraak:

Zorg ervoor dat de juiste taal is geselecteerd
Schrijf complexe woorden fonetisch
Gebruik SSML-tags voor precieze controle

Onnatuurlijke pauzes:

Controleer de interpunctie
Configureer pauzes tussen zinnen
Gebruik handmatige pauzes .- of <break time=""/>
Verwijder extra spaties en regeleinden

SSML fouten:

Controleer de correctheid van de tags
Niet alle stemmen ondersteunen alle SSML-tags

Extra Functies

SSML (Speech Synthesis Markup Language)

Voor deskundige stemcontrole, gebruik SSML-tags:

<break time="2s"/> — pauzes
<emphasis level="strong"> — stem nadruk
<prosody rate="slow" pitch="low"> — spraakkenmerken wijzigen

⚠️ Let op: Verschillende stemmen ondersteunen verschillende sets SSML-tags. Test de functionaliteit voor elke specifieke stem.

Geschiedenis en Favorieten

Projectgeschiedenis: Automatisch opgeslagen voor 30 dagen
Favorieten: Voeg belangrijke projecten toe voor permanente opslag

Integratie en API

API is beschikbaar voor ontwikkelaars om SpeechGen.io te integreren in hun eigen applicaties en diensten.

Mijn bestand wordt niet geüpload naar SpeechGen. Wat moet ik doen?

Controleer eerst of je bestand in een ondersteund formaat is (DOCX, PDF of TXT). Zorg ervoor dat het bestand niet beschadigd is en probeer het opnieuw te uploaden. Als het probleem aanhoudt, kopieer de tekst handmatig en plak deze direct in het tekstvak. Controleer ook of de bestandsgrootte de platformlimieten niet overschrijdt.

Hoe lang bewaart SpeechGen mijn gegenereerde audiobestanden?

Je projectgeschiedenis wordt automatisch 30 dagen bewaard. De slimme cache (voor besparingen op zinniveau) is 7 dagen geldig. Om bestanden permanent te bewaren, voeg je ze toe aan je favorieten. Dit zorgt ervoor dat je belangrijke audioprojecten nooit verloren gaan en toegankelijk blijven in je profiel.

Kan ik verschillende stemmen gebruiken voor verschillende personages in één audiobestand?

Ja! SpeechGen biedt meertalige audio generatie (dialoogmodus). Je kunt verschillende stemmen toewijzen aan verschillende tekstsecties, waardoor het perfect is voor audioboeken met meerdere personages, educatieve dialogen of podcasts met meerdere sprekers. Je kunt zelfs meertalige stemmen gebruiken om tussen talen te wisselen met behoud van karakterconsistentie.

Verbruikt het wijzigen van audio-instellingen mijn tekenlimieten?

Het hangt af van welke instellingen je wijzigt. Het aanpassen van de spraaksnelheid of toonhoogte vereist volledige regeneratie en verbruikt je tekenlimieten, aangezien deze wijzigingen de gehele stem synthese beïnvloeden. Je kunt echter vrijelijk pauzes tussen zinnen en alinea's aanpassen zonder limietverbruik. Bovendien gebruikt SpeechGen slimme caching: als je een grote tekst genereert, vervolgens slechts één zin bewerkt en opnieuw genereert, zal het systeem je alleen voor die ene gewijzigde zin belasten, niet voor de hele tekst. Dit cachesysteem bewaart je ongewijzigde zinnen 7 dagen, waardoor iteratieve bewerking zeer zuinig is.

Video

Nog Steeds Vragen?

Krijg hulp van onze community! Stel je vragen in onze Telegram chat: https://t.me/speechgen