08-09-2025 , 16-09-2025
Open de taal dropdown en kies de taal van je tekst. Ondersteunde talen: Meer dan 150 talen (AI stemmen bibliotheek).
Nadat je de taal hebt gekozen, verschijnt er een lijst met stemmen. Luister naar voorbeelden en kies je favoriet
Kopieer je tekst naar het tekstvak of upload een bestand (DOCX, PDF). Gebruik voor het omzetten van ondertitels naar spraak de speciale SRT naar stem pagina.
Wacht op de verwerking en download je kant-en-klare audiobestand
Dat is alles! Je eerste voice-over is in een paar minuten klaar.
💡 Tip: Let bij het kopiëren uit PDF-bestanden extra goed op de tekst — er kunnen onzichtbare tekens verschijnen die de audio verpesten!
Maximaal per generatie: 2.000.000 tekens (≈ 285.000-330.000 woorden) - dit is de indrukwekkende hoeveelheid tekst die je in één generatie naar spraak kunt omzetten, waardoor het ideaal is voor lange content zoals hele boeken of uitgebreide documentatie.
⚠️ Belangrijk: Selecteer eerst de juiste taal voor je tekst
Nadat je de taal hebt gekozen, opent er een lijst met beschikbare stemmen. Luister naar voorbeelden door op de afspeelknop voor elke stem te klikken om degene te vinden die het beste bij je past. Je ziet verschillende stemtypes beschikbaar: Reguliere stemmen bieden standaardkwaliteit, PRO stemmen bieden verbeterde kwaliteit en natuurlijkheid, en Meertalige stemmen (gemarkeerd met taalcodes zoals Ava_US, Ava_ES) stellen je in staat om stemconsistentie te behouden over verschillende talen. Neem de tijd om elke stem te beluisteren, aangezien ze aanzienlijk verschillen in toon, emotie en karakter.
Onder het tekstvak, boven de genereerknop, kun je de pauze-instellingen aanpassen:
Klik op de knop "Genereer Spraak" onder het tekstvak om het conversieproces te starten. De verwerkingstijd hangt af van de lengte van je tekst - kortere teksten zijn binnen enkele seconden klaar, terwijl langere documenten enkele minuten kunnen duren. Zodra de generatie voltooid is, kun je het resultaat direct in de browser beluisteren om er zeker van te zijn dat het aan je verwachtingen voldoet.
Nadat de generatie is voltooid, verschijnt er een "Download" knop. Standaard kun je het bestand gewoon als MP3 downloaden. Als je echter een ander formaat nodig hebt (WAV of OPUS) of de audiokwaliteit wilt wijzigen (sample rate van 8000 tot 44000 Hz), moet je eerst deze opties selecteren uit de dropdown menu's, de spraak opnieuw genereren met je gekozen instellingen, en vervolgens het bestand downloaden met je voorkeurspecificaties.
Snelheidsschaal:
Waarom deze schaal: Fractionele waarden kleiner dan 1 vertragen de spraak, groter dan 1 versnellen deze. Dit maakt een nauwkeurige tempo selectie voor je publiek mogelijk.
Snelheid aanbevelingen:
Toonhoogte bereik: van -20 tot +20 met stap 2
Waarom stap 2: Een stap van 2 eenheden zorgt voor een merkbare maar niet scherpe toonhoogteverandering. Kleinere stappen zouden niet opvallen, grotere stappen te dramatisch.
Invloed toonhoogte:
Toepassingen:
Pauzes tussen zinnen: 300ms (standaard)
Pauzes tussen alinea's: 400ms (standaard)
Deze instellingen kunnen worden gewijzigd in dropdown menu's van 150ms tot 30 seconden.
Via interface:
Via tags:
Voeg de tag <break time="200ms"/> of <break time="2s"/> in op de gewenste locatie
Pauze regels:
Wanneer pauzes gebruiken:
De dialoogfunctie maakt het mogelijk om verschillende stemmen in één tekst te gebruiken.
De meertalige dialoogfunctie opent creatieve mogelijkheden die verder gaan dan alleen stemmen van personages. Docenten vreemde talen kunnen deze functie bijvoorbeeld gebruiken om dezelfde zin op verschillende snelheden te demonstreren voor taalonderwijs, waardoor studenten de uitspraak op verschillende begripsniveaus kunnen begrijpen. Voor gedetailleerde technieken en toepassingen in de klas, zie onze gids over het gebruik van tekst-naar-spraak voor het onderwijzen van vreemde talen.
Stemmen met taalcodes (bijv. Ava_US, Ava_ES, Ava_DE) zijn ontworpen om consistente stemherkenning te behouden over verschillende talen. Deze meertalige stemmen stellen je in staat om een uniforme stijl te creëren voor meertalige content, zodat hetzelfde stemkarakter meerdere talen naadloos kan spreken. Deze functie is bijzonder nuttig in de dialoogmodus, waar je kunt wisselen tussen talen terwijl je dezelfde herkenbare stem persoonlijkheid behoudt gedurende je audioproject.
SpeechGen stelt je in staat om je gegenereerde audio op te splitsen in meerdere segmenten binnen één syntheseproject, waardoor het perfect is voor video-editors die aparte audiobestanden nodig hebben voor verschillende scènes of hoofdstukken. Deze functie is bijzonder nuttig voor het maken van voice-overs voor YouTube-video's, online cursussen of elk project dat nauwkeurige audiosynchronisatie vereist.
Om je audio op te splitsen, plaats je simpelweg je cursor waar je de tekst wilt verdelen en klik je op de knipknop in het menu. Dit voegt een <cut/> tag toe op die positie. Je kunt deze tag ook handmatig typen of kopiëren en plakken door je tekst heen. Voor aangepaste bestandsnamen, gebruik dit formaat:
<cut name="jouw-bestandsnaam"/>
Deze functie helpt je segmenten te organiseren met betekenisvolle namen zoals:
<cut name="intro"/>
<cut name="hoofdstuk-1"/>
Zodra je ten minste één segment tag hebt toegevoegd, verschijnt er na de generatie een "segmenten downloaden" knop. Klik erop om alle segmenten tegelijk te downloaden, of gebruik de "meer" knop op de audiospeler om toegang te krijgen tot individuele segmenten. Elk bestand wordt automatisch benoemd met een unieke ID, volgnummer en beschrijvende titel (bijv. "7054789_1_eerste-zin"), waardoor het gemakkelijk is om je audiobestanden in je bewerkingssoftware te identificeren en te organiseren.
Splits voor grotere projecten op in meerdere generaties. Voor uitgebreide instructies, geavanceerde technieken en videotutorials, bezoek onze complete documentatie over audio segmentatie.
Sommige stemmen hebben intonatie grafieken:
Intonatie grafieken zijn beschikbaar op stemmen die een instellingen icoon tonen naast de stemnaam - deze functie is te vinden op meer dan de helft van de stemmen in de bibliotheek, inclusief zowel reguliere als PRO opties
Selecteer de zin waarin je de intonatie wilt aanpassen en druk op de intonatie knop. Deze interface verschijnt.
SpeechGen. gebruikt een intelligent cachesysteem dat je limieten aanzienlijk bespaart. Het systeem werkt door elke zin (tot 100.000 tekens) 7 dagen in de cache op te slaan. Wanneer je je audio opnieuw genereert, worden alle ongewijzigde zinnen automatisch gratis uit de cache opgehaald - je betaalt alleen voor nieuwe of bewerkte zinnen. Dit betekent dat je incrementele wijzigingen in je tekst kunt aanbrengen zonder elke keer je volledige tekenlimiet te verbruiken. Projectgeschiedenis wordt 30 dagen opgeslagen en bestanden die je aan favorieten toevoegt, worden permanent bewaard.
Opslagperiodes:
Stem klinkt onnatuurlijk:
Onjuiste uitspraak:
Onnatuurlijke pauzes:
SSML fouten:
Voor deskundige stemcontrole, gebruik SSML-tags:
⚠️ Let op: Verschillende stemmen ondersteunen verschillende sets SSML-tags. Test de functionaliteit voor elke specifieke stem.
API is beschikbaar voor ontwikkelaars om SpeechGen.io te integreren in hun eigen applicaties en diensten.
Controleer eerst of je bestand in een ondersteund formaat is (DOCX, PDF of TXT). Zorg ervoor dat het bestand niet beschadigd is en probeer het opnieuw te uploaden. Als het probleem aanhoudt, kopieer de tekst handmatig en plak deze direct in het tekstvak. Controleer ook of de bestandsgrootte de platformlimieten niet overschrijdt.
Je projectgeschiedenis wordt automatisch 30 dagen bewaard. De slimme cache (voor besparingen op zinniveau) is 7 dagen geldig. Om bestanden permanent te bewaren, voeg je ze toe aan je favorieten. Dit zorgt ervoor dat je belangrijke audioprojecten nooit verloren gaan en toegankelijk blijven in je profiel.
Ja! SpeechGen biedt meertalige audio generatie (dialoogmodus). Je kunt verschillende stemmen toewijzen aan verschillende tekstsecties, waardoor het perfect is voor audioboeken met meerdere personages, educatieve dialogen of podcasts met meerdere sprekers. Je kunt zelfs meertalige stemmen gebruiken om tussen talen te wisselen met behoud van karakterconsistentie.
Het hangt af van welke instellingen je wijzigt. Het aanpassen van de spraaksnelheid of toonhoogte vereist volledige regeneratie en verbruikt je tekenlimieten, aangezien deze wijzigingen de gehele stem synthese beïnvloeden. Je kunt echter vrijelijk pauzes tussen zinnen en alinea's aanpassen zonder limietverbruik. Bovendien gebruikt SpeechGen slimme caching: als je een grote tekst genereert, vervolgens slechts één zin bewerkt en opnieuw genereert, zal het systeem je alleen voor die ene gewijzigde zin belasten, niet voor de hele tekst. Dit cachesysteem bewaart je ongewijzigde zinnen 7 dagen, waardoor iteratieve bewerking zeer zuinig is.
Krijg hulp van onze community! Stel je vragen in onze Telegram chat: https://t.me/speechgen
Internationale Telegram-chat @speechgen
Persoonlijke ondersteuning in Telegram @speechgen_alex