Sådan bruger du Tekst til Tale på SpeechGen.io: Komplet Guide

07-09-2025 , 16-09-2025

🚀 Hurtig Start — Opret Lyd på 4 Trin

Trin 1: Vælg Sprog

Åbn sprogmenuen og vælg sproget for din tekst. Understøttede sprog: Over 150 sprog (AI-stemmebibliotek).

Trin 2: Vælg Stemme

Efter valg af sprog vises en liste over stemmer. Lyt til prøver og vælg din favorit

Trin 3: Indsæt Tekst

Kopiér din tekst ind i tekstfeltet eller upload en fil (DOCX, PDF). For at konvertere undertekster til tale, brug den dedikerede SRT til tale side.

Trin 4: Klik på "Generer Tale" (blå knap)

Trin 4: Klik Generer Tale

Vent på behandling og download din færdige lydfil

Det var det! Din første voiceover er klar på kun et par minutter.

Tekstforberedelse

Anbefalet:

Brug almindelig tekst uden unødvendige symboler
Placer tegnsætning korrekt (punktummer, kommaer, udråbstegn)
Opdel lang tekst i afsnit

Undgå:

Emojis og smileys (kan forstyrre lydgenerering)
Eksotiske symboler: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
Specielle Unicode-symboler:

💡 Tip: Når du kopierer fra PDF-filer, skal du være særligt opmærksom på teksten — usynlige tegn kan forekomme, som kan ødelægge lyden!

Grænser og Begrænsninger

Understøttede sprog: 150+ sprog (fuld liste).
Uploadformater: almindelig tekst, DOCX, PDF, SRT.

Maksimum pr. generering: 2.000.000 tegn (≈ 285.000-330.000 ord) - dette er den imponerende mængde tekst, du kan konvertere til tale i en enkelt generering, hvilket gør den ideel til langt indhold som hele bøger eller omfattende dokumentation.

Detaljerede Trin-for-Trin Instruktioner

Trin 1: Upload Tekst

Indsæt tekst: Kopiér din tekst ind i tekstfeltet
Upload fil: Eller klik på upload-knappen og vælg en fil (DOCX, PDF)
Tjek tekst: Sørg for, at teksten vises korrekt

Trin 2: Vælg Sprog

⚠️ Vigtigt: Vælg først det korrekte sprog for din tekst

Åbn rullemenuen for sprog
Find det ønskede sprog (150+ sprog tilgængelige)
For tekster på flere sprog, brug lydgenerering med flere stemmer

Trin 3: Vælg Stemme

Efter valg af sprog åbnes en liste over tilgængelige stemmer. Lyt til prøver ved at klikke på afspilningsknappen for hver stemme for at finde den, der passer bedst til dine behov. Du vil se forskellige stemmetyper tilgængelige: Regelmæssige stemmer tilbyder standardkvalitet, PRO-stemmer giver forbedret kvalitet og naturlighed, og Flersprogede stemmer (markeret med sprogkoder som Ava_US, Ava_ES) giver dig mulighed for at bevare stemmekonsistens på tværs af forskellige sprog. Brug tid på at forhåndsvise hver stemme, da de varierer betydeligt i tone, følelse og karakter.

Trin 4: Konfigurer Parametre

Taletempo: fra x0.1 (meget langsomt) til x2.2 (meget hurtigt)
Stemmehøjde: fra -20 til +20 (trin 2)

Under tekstfeltet, over genereringsknappen, kan du justere pauseindstillingerne:

pauseindstillinger

Pauser mellem sætninger: 150ms - 30 sekunder
Pauser mellem afsnit: 150ms - 30 sekunder

Trin 5: Generer Tale

Klik på knappen "Generer Tale" under tekstfeltet for at starte konverteringsprocessen. Behandlingstiden afhænger af din tekstlængde - kortere tekster færdiggøres på sekunder, mens længere dokumenter kan tage et par minutter. Når genereringen er færdig, kan du lytte til resultatet direkte i browseren for at sikre, at det lever op til dine forventninger.

Trin 6: Download

Når genereringen er færdig, vises en "Download"-knap. Som standard kan du blot downloade filen som MP3. Men hvis du har brug for et andet format (WAV eller OPUS) eller ønsker at ændre lydkvaliteten (sample rate fra 8000 til 44000 Hz), skal du først vælge disse indstillinger fra rullemenuerne, regenerere talen med dine valgte indstillinger og derefter downloade filen med dine foretrukne specifikationer.

Lydparameterindstillinger

Taletempo

Hastighedsskala:

x0.1 - x0.9: Nedsat hastighed (til komplekst materiale, sprogindlæring)
x1.0: Normal hastighed (standard)
x1.1 - x2.2: Øget hastighed (til dynamisk indhold)

Hvorfor denne skala: Brøkdele mindre end 1 sænker taletempoet, større end 1 øger det. Dette giver mulighed for præcis tempo-valg for dit publikum.

Hastighedsanbefalinger:

Uddannelse: x0.8-x1.0 (for bedre forståelse)
Præsentationer: x0.9-x1.1 (officielt tempo)
Podcasts: x1.0-x1.2 (livligt tempo)
YouTube: x1.1-x1.4 (fastholdelse af opmærksomhed)

Stemmehøjde

Tonehøjdeområde: fra -20 til +20 med trin på 2

Hvorfor trin 2: Et trin på 2 enheder giver en mærkbar, men ikke skarp ændring i tonehøjden. Mindre trin ville være umærkelige, større trin for dramatiske.

Tonehøjdeindflydelse:

Negative værdier (-2 til -20): Gør stemmen lavere, mere seriøs, autoritativ
Positive værdier (+2 til +20): Gør stemmen højere, venligere, mere energisk
0: Neutral tonehøjde (standard)

Anvendelser:

Forretningsindhold: -4 til +2
Børneindhold: +4 til +12
Dramatisk indhold: -8 til -16
Venligt indhold: +2 til +8

Arbejde med Pauser

Automatiske Pauser

Pauser mellem sætninger: 300ms (standard)

Pauser mellem afsnit: 400ms (standard)

Disse indstillinger kan ændres i rullemenuer fra 150ms til 30 sekunder.

Manuel Indsættelse af Pause

Via grænsefladen:

Placer markøren på det ønskede sted i teksten
Klik på knappen "Pause" i menuen
Symbolet .- vises i teksten

Via tags:

Indsæt tagget <break time="200ms"/> eller <break time="2s"/> på det ønskede sted

Pause regler:

Maksimal pause: 30 sekunder
Flere pauser kan placeres i træk for længere forsinkelse
Pauser forbruger ikke yderligere grænser

Hvornår skal pauser bruges:

Før vigtige udsagn
Efter retoriske spørgsmål
Mellem forskellige emner
For at skabe dramatisk effekt

Lyd med Flere Stemmer

Funktionen til dialoger giver mulighed for at bruge forskellige stemmer i én tekst.

Anvendelser:

Lydbøger: Forskellige stemmer til karakterer
Uddannelsesmæssige dialoger: Lærer og elev
Præsentationer: Hovedtaler og kommentator
Podcasts: Flere værter

Funktionen til dialoger med flere stemmer åbner op for kreative muligheder ud over blot karakterstemmer. Sprogundervisere kan for eksempel bruge denne funktion til at demonstrere den samme frase med forskellige hastigheder til sprogindlæring, hvilket hjælper eleverne med at forstå udtale på forskellige niveauer. For detaljerede teknikker og anvendelser i klasseværelset, se vores vejledning om brug af tekst-til-tale til fremmedsprogsundervisning.

Valg af Stemme

Flersprogede Stemmer

Stemmer med sprogkoder (f.eks. Ava_US, Ava_ES, Ava_DE) er designet til at bevare en ensartet stemmegenkendelse på tværs af forskellige sprog. Disse flersprogede stemmer giver dig mulighed for at skabe en ensartet stil for flersproget indhold, hvilket sikrer, at den samme stemmekarakter kan tale flere sprog problemfrit. Denne funktion er især nyttig i dialogtilstand, hvor du kan skifte mellem sprog, mens du bevarer den samme genkendelige stemmepersonlighed gennem hele dit lydprojekt.

Lydsegmentering

SpeechGen giver dig mulighed for at opdele din genererede lyd i flere segmenter inden for et enkelt synteseprojekt, hvilket gør det perfekt til videoredigerere, der har brug for separate lydfiler til forskellige scener eller kapitler. Denne funktion er især nyttig til at skabe voiceovers til YouTube-videoer, onlinekurser eller ethvert projekt, der kræver præcis lydsynkronisering.

Sådan Opretter du Segmenter

For at opdele din lyd skal du blot placere markøren, hvor du vil opdele teksten, og klikke på klippeknappen i menuen. Dette indsætter et <cut/> tag på den position. Du kan også manuelt skrive eller kopiere/indsætte dette tag i din tekst. For brugerdefinerede filnavne skal du bruge dette format:

<cut name="dit-filnavn"/>

Denne funktion hjælper dig med at organisere segmenter med meningsfulde navne som:

<cut name="intro"/>

<cut name="kapitel-1"/>

Download og Håndtering af Segmenter

Når du har tilføjet mindst ét segment-tag, vises en "download segmenter"-knap efter generering. Klik på den for at downloade alle segmenter på én gang, eller brug "mere"-knappen på lydafspilleren for at få adgang til individuelle segmenter. Hver fil navngives automatisk med et unikt ID, sekvensnummer og en beskrivende titel (f.eks. "7054789_1_første-sætning"), hvilket gør det nemt at identificere og organisere dine lydfiler i dit redigeringssoftware.

Segment Begrænsninger

Korte segmenter: Op til 1000 segmenter pr. generering
Lange segmenter: Op til 500 segmenter pr. generering

For større projekter, opdel i flere genereringer. For omfattende instruktioner, avancerede teknikker og videotutorials, besøg vores komplette dokumentation for lydsegmentering.

Intonationsopsætning

Nogle stemmer har intonationsgrafer:

Intonationsgrafer er tilgængelige på stemmer, der viser et indstillings ikon ved siden af stemmenavnet - denne funktion findes på mere end halvdelen af stemmerne i biblioteket, inklusive både almindelige og PRO-muligheder

Træk punkter på grafen for at ændre intonationen
Hæv punkter for at øge tonehøjden på bestemte ord
Sænk punkter for at skabe en mere seriøs tone
Eksperimenter med forskellige kurver for naturlighed

Træk punkter på grafen for at ændre intonationen

Vælg den sætning, hvor du vil justere intonationen, og tryk på knappen intonation. Denne grænseflade vises.

Cache System og Grænsebesparelse

Smart Cache

SpeechGen bruger et intelligent cache-system, der markant sparer dine grænser. Systemet fungerer ved at gemme hver sætning (op til 100.000 tegn) i cachen i 7 dage. Når du regenererer din lyd, hentes alle uændrede sætninger automatisk fra cachen gratis - du betaler kun for nye eller redigerede sætninger. Dette betyder, at du kan foretage gradvise redigeringer af din tekst uden at forbruge hele din tegnkvote hver gang. Projektets historik gemmes i 30 dage, og filer du tilføjer til favoritter gemmes permanent.

Opbevaringsperioder:

Sætningscache: 7 dage
Projekthistorik: 30 dage
Favoritfiler: Gemmes permanent

Fejlfinding af Almindelige Problemer

Problemer med Lydkvalitet

Stemmen lyder unaturlig:

Prøv PRO-stemmer
Reducer hastigheden til x0.9-x1.1
Tjek korrekt tegnsætning
Brug neutral tonehøjde (0)

Forkert udtale:

Sørg for, at det korrekte sprog er valgt
Skriv komplekse ord fonetisk
Brug SSML-tags for præcis kontrol

Unaturlige pauser:

Tjek tegnsætning
Konfigurer pauser mellem sætninger
Brug manuelle pauser .- eller <break time=""/>
Fjern ekstra mellemrum og linjeskift

SSML-fejl:

Tjek korrektheden af tags
Ikke alle stemmer understøtter alle SSML-tags

Yderligere Funktioner

SSML (Speech Synthesis Markup Language)

For ekspert stemmekontrol, brug SSML-tags:

<break time="2s"/> — pauser
<emphasis level="strong"> — stemmebetoning
<prosody rate="slow" pitch="low"> — ændring af talekarakteristika

⚠️ Opmærksomhed: Forskellige stemmer understøtter forskellige sæt af SSML-tags. Test funktionaliteten for hver specifik stemme.

Historik og Favoritter

Projekthistorik: Gemmes automatisk i 30 dage
Favoritter: Tilføj vigtige projekter for permanent opbevaring

Integration og API

API er tilgængelig for udviklere til at integrere SpeechGen.io i deres egne applikationer og tjenester.

Min fil vil ikke uploade til SpeechGen. Hvad skal jeg gøre?

Tjek først, at din fil er i et understøttet format (DOCX, PDF eller TXT). Sørg for, at filen ikke er beskadiget, og prøv at uploade igen. Hvis problemet fortsætter, skal du kopiere teksten manuelt og indsætte den direkte i tekstfeltet. Verificer også, at din filstørrelse ikke overstiger platformens grænser.

Hvor længe gemmer SpeechGen mine genererede lydfiler?

Din projekthistorik gemmes automatisk i 30 dage. Smart cachen (til sætningsbaserede besparelser) varer 7 dage. For at gemme filer permanent, tilføj dem til dine favoritter. Dette sikrer, at dine vigtige lydprojekter aldrig går tabt og forbliver tilgængelige i din profil.

Kan jeg bruge forskellige stemmer til forskellige karakterer i én lydfil?

Ja! SpeechGen tilbyder lydgenerering med flere stemmer (dialogtilstand). Du kan tildele forskellige stemmer til forskellige tekstafsnit, hvilket gør det perfekt til lydbøger med flere karakterer, uddannelsesmæssige dialoger eller podcasts med flere talere. Du kan endda bruge flersprogede stemmer til at skifte mellem sprog, mens du bevarer karakterkonsistens.

Forbruger ændring af lydindstillinger mine tegn-grænser?

Det afhænger af, hvilke indstillinger du ændrer. Justering af taletempo eller tonehøjde kræver fuld regenerering og vil forbruge dine tegn-grænser, da disse ændringer påvirker hele stemmesyntesen. Du kan dog frit ændre pauser mellem sætninger og afsnit uden forbrug af grænser. Desuden bruger SpeechGen smart caching: hvis du genererer en stor tekst, derefter redigerer kun én sætning og regenererer, vil systemet kun opkræve dig for den enkelte ændrede sætning, ikke hele teksten. Dette cache-system gemmer dine uændrede sætninger i 7 dage, hvilket gør iterativ redigering meget økonomisk.

Video

Stadig Spørgsmål?

Få hjælp fra vores fællesskab! Stil dine spørgsmål i vores Telegram-chat: https://t.me/speechgen