22-09-2025 , 22-09-2025
Speechgen tilbyder en unik økonomisk caching-funktion, der markant reducerer tid og omkostninger til tekst-til-tale-konvertering. I denne artikel vil vi udforske, hvordan denne funktion virker, dens fordele, og hvordan den hjælper dig med at spare under voiceovers.
Når du syntetiserer tale, husker Speechgen resultatet af hver sætning. For eksempel:
Forestil dig, at du arbejder på at indtale et undervisningskursus med 20 lektioner. Efter at have afsluttet arbejdet beslutter du dig for at tilføje en kort introduktion til hver lektion. Med en almindelig tjeneste ville du skulle indtale hele materialet igen, hvilket ville medføre betydelige omkostninger. Med Speechgen betaler du kun for at indtale de nye introduktioner, hvilket sparer ressourcer og tid.
Her er en sammenligning af Speechgen med andre tjenester:
Eksempel |
Andre TTS |
Speechgen |
Eksempel #1: 30 sætninger |
100% omkostning |
100% omkostning |
Eksempel #2: 30 sætninger + 10 nye |
100% omkostning |
25% omkostning |
Med andre talesyntesetjenester koster hver voiceover 100% af alt, hvad du har indtalt. Med Speechgen indtales kun nye eller ændrede sætninger. Som det ses i tabellen, brugte Speechgen ved en gentaget voiceover kun 25% af det samlede antal tegn i stedet for 100%, da 75% af teksten blev hentet fra tidligere indtalt indhold.
Det betyder, at du ikke behøver at bekymre dig om gentagne omkostninger, når du reviderer din tekst. Du kan vende tilbage til din tekst senere og arbejde med den.
Herover bruges en bogtilstand til hurtigere indtalning af store tekster, der behandles i store tekstblokke i stedet for sætninger. Speechgen kan indtale op til 2.000.000 tegn ad gangen, men økonomisk caching virker op til 100.000 tegn.
Indtalte sætninger gemmes kun i hukommelsen i 1 uge. Du har 7 dage til at supplere eller revidere voiceoveren.
Derudover gemmes hele voiceover-historikken i din profil i 30 dage. Det betyder, at du inden for 30 dage kan downloade teksten og filen i deres helhed. Selve cachen vil dog kun blive gemt i 7 dage.
Hvis du for eksempel beslutter dig for at tilføje noget til voiceoveren efter 25 dage, vil grænserne blive trukket igen for hele projektet. Ved at gemme voiceoveren i favoritter kan du beholde lyden med teksten for evigt, men cachen vil stadig kun blive gemt i 7 dage.
Din tekst og lydfil gemmes i din profil, men ikke cachen, så husk dette, når du arbejder.
Cache virker kun for uændrede sætninger. Hvis du ændrer selv ét bogstav eller fjerner et komma i en sætning, betragtes den som ny af systemet.
Original tekst:
Tilføjelse af en ny sætning:
Resultat: Speechgen tager de første tre sætninger fra cachen og indtaler kun den fjerde. Omkostninger påløber kun for den fjerde sætning.
Original tekst:
Ændring af ét ord i den anden sætning:
Resultat: Speechgen tager første og tredje sætning fra cachen, men indtaler den anden igen.
Original tekst:
Fjernelse af kommaerne i den tredje sætning:
Resultat: Speechgen vil genindtale den tredje sætning og tage den første og anden sætning fra cachen. Den tredje sætning betragtes som ændret på grund af fjernelsen af kommaer.
Hvis du tilføjer en ny pause-tag, som f.eks. break, betragtes det også som en ændring af sætningen. Systemet vil genanalysere og genindtale den.
<break time="200ms"/>
Faktisk hentes sætninger fra den økonomiske cache baseret på en fuldstændig match, tegn for tegn. Hvis der er et nyt tegn, eller hvis et tegn mangler i sætningen, vil programmet ikke kunne matche den præcist.
Hvis du ændrer hastigheds- eller toneindstillingerne, vil det være en helt ny voiceover, og den økonomiske cache vil ikke virke. Når du ændrer hastighed eller tone, genindtaler det neurale netværk teksten med disse nye parametre. Dette er ikke en software-hastighedsændring eller toneændring; det er en fuld genindtalning.
Ændring af taler resulterer også i en fuld genindtalning. Her udfører det neurale netværk alt arbejdet igen. Derfor, hvis du justerer stemmen, gør dette for 1-2 sætninger, og når du er tilfreds med hastigheden og tonen, indtal hele den ønskede tekst.
På denne specielle side https://speechgen.io/da/subs/ kan du indtale undertekster. For at passe til timingen er det ofte nødvendigt at øge hastigheden på talen for at opfylde den krævede timing. I dette tilfælde virker den økonomiske cache, da Speechgen først indtaler og derefter programmatisk øger hastigheden på underteksten.
Du kan ændre pauserne i indstillingerne under indtalingfeltet, og cachen vil fungere perfekt. Vi gemmer hele sætninger i hukommelsen, og systemet kombinerer dem derefter til lyd. På denne måde kan du justere pauser mellem sætninger eller afsnit uden ekstra omkostninger.
Hvis du vælger et andet format – ogg, wav, opus – og trykker på revoice, vil systemet ikke opkræve dig nogen grænser. Dette er gratis. Hvis du indtalte og derefter indså, at du havde brug for et andet format, skal du ændre det uden frygt for dobbeltomkostninger.
Hvis du ændrer Sample Rate i indstillingerne og trykker på revoice igen, vil systemet ikke opkræve dig nogen grænser. Dette er gratis.
Speechgens økonomiske caching-system tilbyder betydelige fordele:
Speechgen sparer dine ressourcer og giver værktøjer til mere effektivt arbejde med lydindhold, hvilket gør det til et ideelt valg for dem, der værdsætter effektivitet og kvalitet inden for talesyntese.