07-09-2025 , 16-09-2025
Åbn sprogmenuen og vælg sproget for din tekst. Understøttede sprog: Over 150 sprog (AI-stemmebibliotek).
Efter valg af sprog vises en liste over stemmer. Lyt til prøver og vælg din favorit
Kopiér din tekst ind i tekstfeltet eller upload en fil (DOCX, PDF). For at konvertere undertekster til tale, brug den dedikerede SRT til tale side.
Vent på behandling og download din færdige lydfil
Det var det! Din første voiceover er klar på kun et par minutter.
💡 Tip: Når du kopierer fra PDF-filer, skal du være særligt opmærksom på teksten — usynlige tegn kan forekomme, som kan ødelægge lyden!
Maksimum pr. generering: 2.000.000 tegn (≈ 285.000-330.000 ord) - dette er den imponerende mængde tekst, du kan konvertere til tale i en enkelt generering, hvilket gør den ideel til langt indhold som hele bøger eller omfattende dokumentation.
⚠️ Vigtigt: Vælg først det korrekte sprog for din tekst
Efter valg af sprog åbnes en liste over tilgængelige stemmer. Lyt til prøver ved at klikke på afspilningsknappen for hver stemme for at finde den, der passer bedst til dine behov. Du vil se forskellige stemmetyper tilgængelige: Regelmæssige stemmer tilbyder standardkvalitet, PRO-stemmer giver forbedret kvalitet og naturlighed, og Flersprogede stemmer (markeret med sprogkoder som Ava_US, Ava_ES) giver dig mulighed for at bevare stemmekonsistens på tværs af forskellige sprog. Brug tid på at forhåndsvise hver stemme, da de varierer betydeligt i tone, følelse og karakter.
Under tekstfeltet, over genereringsknappen, kan du justere pauseindstillingerne:
Klik på knappen "Generer Tale" under tekstfeltet for at starte konverteringsprocessen. Behandlingstiden afhænger af din tekstlængde - kortere tekster færdiggøres på sekunder, mens længere dokumenter kan tage et par minutter. Når genereringen er færdig, kan du lytte til resultatet direkte i browseren for at sikre, at det lever op til dine forventninger.
Når genereringen er færdig, vises en "Download"-knap. Som standard kan du blot downloade filen som MP3. Men hvis du har brug for et andet format (WAV eller OPUS) eller ønsker at ændre lydkvaliteten (sample rate fra 8000 til 44000 Hz), skal du først vælge disse indstillinger fra rullemenuerne, regenerere talen med dine valgte indstillinger og derefter downloade filen med dine foretrukne specifikationer.
Hastighedsskala:
Hvorfor denne skala: Brøkdele mindre end 1 sænker taletempoet, større end 1 øger det. Dette giver mulighed for præcis tempo-valg for dit publikum.
Hastighedsanbefalinger:
Tonehøjdeområde: fra -20 til +20 med trin på 2
Hvorfor trin 2: Et trin på 2 enheder giver en mærkbar, men ikke skarp ændring i tonehøjden. Mindre trin ville være umærkelige, større trin for dramatiske.
Tonehøjdeindflydelse:
Anvendelser:
Pauser mellem sætninger: 300ms (standard)
Pauser mellem afsnit: 400ms (standard)
Disse indstillinger kan ændres i rullemenuer fra 150ms til 30 sekunder.
Via grænsefladen:
Via tags:
Indsæt tagget <break time="200ms"/> eller <break time="2s"/> på det ønskede sted
Pause regler:
Hvornår skal pauser bruges:
Funktionen til dialoger giver mulighed for at bruge forskellige stemmer i én tekst.
Funktionen til dialoger med flere stemmer åbner op for kreative muligheder ud over blot karakterstemmer. Sprogundervisere kan for eksempel bruge denne funktion til at demonstrere den samme frase med forskellige hastigheder til sprogindlæring, hvilket hjælper eleverne med at forstå udtale på forskellige niveauer. For detaljerede teknikker og anvendelser i klasseværelset, se vores vejledning om brug af tekst-til-tale til fremmedsprogsundervisning.
Stemmer med sprogkoder (f.eks. Ava_US, Ava_ES, Ava_DE) er designet til at bevare en ensartet stemmegenkendelse på tværs af forskellige sprog. Disse flersprogede stemmer giver dig mulighed for at skabe en ensartet stil for flersproget indhold, hvilket sikrer, at den samme stemmekarakter kan tale flere sprog problemfrit. Denne funktion er især nyttig i dialogtilstand, hvor du kan skifte mellem sprog, mens du bevarer den samme genkendelige stemmepersonlighed gennem hele dit lydprojekt.
SpeechGen giver dig mulighed for at opdele din genererede lyd i flere segmenter inden for et enkelt synteseprojekt, hvilket gør det perfekt til videoredigerere, der har brug for separate lydfiler til forskellige scener eller kapitler. Denne funktion er især nyttig til at skabe voiceovers til YouTube-videoer, onlinekurser eller ethvert projekt, der kræver præcis lydsynkronisering.
For at opdele din lyd skal du blot placere markøren, hvor du vil opdele teksten, og klikke på klippeknappen i menuen. Dette indsætter et <cut/> tag på den position. Du kan også manuelt skrive eller kopiere/indsætte dette tag i din tekst. For brugerdefinerede filnavne skal du bruge dette format:
<cut name="dit-filnavn"/>
Denne funktion hjælper dig med at organisere segmenter med meningsfulde navne som:
<cut name="intro"/>
<cut name="kapitel-1"/>
Når du har tilføjet mindst ét segment-tag, vises en "download segmenter"-knap efter generering. Klik på den for at downloade alle segmenter på én gang, eller brug "mere"-knappen på lydafspilleren for at få adgang til individuelle segmenter. Hver fil navngives automatisk med et unikt ID, sekvensnummer og en beskrivende titel (f.eks. "7054789_1_første-sætning"), hvilket gør det nemt at identificere og organisere dine lydfiler i dit redigeringssoftware.
For større projekter, opdel i flere genereringer. For omfattende instruktioner, avancerede teknikker og videotutorials, besøg vores komplette dokumentation for lydsegmentering.
Nogle stemmer har intonationsgrafer:
Intonationsgrafer er tilgængelige på stemmer, der viser et indstillings ikon ved siden af stemmenavnet - denne funktion findes på mere end halvdelen af stemmerne i biblioteket, inklusive både almindelige og PRO-muligheder
Vælg den sætning, hvor du vil justere intonationen, og tryk på knappen intonation. Denne grænseflade vises.
SpeechGen bruger et intelligent cache-system, der markant sparer dine grænser. Systemet fungerer ved at gemme hver sætning (op til 100.000 tegn) i cachen i 7 dage. Når du regenererer din lyd, hentes alle uændrede sætninger automatisk fra cachen gratis - du betaler kun for nye eller redigerede sætninger. Dette betyder, at du kan foretage gradvise redigeringer af din tekst uden at forbruge hele din tegnkvote hver gang. Projektets historik gemmes i 30 dage, og filer du tilføjer til favoritter gemmes permanent.
Opbevaringsperioder:
Stemmen lyder unaturlig:
Forkert udtale:
Unaturlige pauser:
SSML-fejl:
For ekspert stemmekontrol, brug SSML-tags:
⚠️ Opmærksomhed: Forskellige stemmer understøtter forskellige sæt af SSML-tags. Test funktionaliteten for hver specifik stemme.
API er tilgængelig for udviklere til at integrere SpeechGen.io i deres egne applikationer og tjenester.
Tjek først, at din fil er i et understøttet format (DOCX, PDF eller TXT). Sørg for, at filen ikke er beskadiget, og prøv at uploade igen. Hvis problemet fortsætter, skal du kopiere teksten manuelt og indsætte den direkte i tekstfeltet. Verificer også, at din filstørrelse ikke overstiger platformens grænser.
Din projekthistorik gemmes automatisk i 30 dage. Smart cachen (til sætningsbaserede besparelser) varer 7 dage. For at gemme filer permanent, tilføj dem til dine favoritter. Dette sikrer, at dine vigtige lydprojekter aldrig går tabt og forbliver tilgængelige i din profil.
Ja! SpeechGen tilbyder lydgenerering med flere stemmer (dialogtilstand). Du kan tildele forskellige stemmer til forskellige tekstafsnit, hvilket gør det perfekt til lydbøger med flere karakterer, uddannelsesmæssige dialoger eller podcasts med flere talere. Du kan endda bruge flersprogede stemmer til at skifte mellem sprog, mens du bevarer karakterkonsistens.
Det afhænger af, hvilke indstillinger du ændrer. Justering af taletempo eller tonehøjde kræver fuld regenerering og vil forbruge dine tegn-grænser, da disse ændringer påvirker hele stemmesyntesen. Du kan dog frit ændre pauser mellem sætninger og afsnit uden forbrug af grænser. Desuden bruger SpeechGen smart caching: hvis du genererer en stor tekst, derefter redigerer kun én sætning og regenererer, vil systemet kun opkræve dig for den enkelte ændrede sætning, ikke hele teksten. Dette cache-system gemmer dine uændrede sætninger i 7 dage, hvilket gør iterativ redigering meget økonomisk.
Få hjælp fra vores fællesskab! Stil dine spørgsmål i vores Telegram-chat: https://t.me/speechgen