22-09-2025 , 22-09-2025
Speechgen bietet eine einzigartige, wirtschaftliche Caching-Funktion, die Zeit und Kosten für die Text-zu-Sprache-Konvertierung erheblich reduziert. In diesem Artikel erfahren Sie, wie diese Funktion funktioniert, welche Vorteile sie hat und wie sie Ihnen beim Sparen von Kosten für Voiceover hilft.
Wenn Sie Sprache synthetisieren, merkt sich Speechgen das Ergebnis jedes Satzes. Zum Beispiel:
Stellen Sie sich vor, Sie arbeiten an der Vertonung eines Bildungsgangs mit 20 Lektionen. Nachdem Sie die Arbeit abgeschlossen haben, entscheiden Sie sich, jeder Lektion eine kurze Einführung hinzuzufügen. Bei einem regulären Dienst müssten Sie das gesamte Material erneut vertonen, was zu erheblichen Kosten führt. Mit Speechgen zahlen Sie nur für die Vertonung der neuen Einführungen und sparen so Ressourcen und Zeit.
Hier ist ein Vergleich von Speechgen mit anderen Diensten:
Beispiel |
Andere TTS |
Speechgen |
Beispiel Nr. 1: 30 Sätze |
100% Kosten |
100% Kosten |
Beispiel Nr. 2: 30 Sätze + 10 neue |
100% Kosten |
25% Kosten |
Bei anderen Sprachsynthesediensten fallen bei jedem Voiceover 100% der Kosten für alles an, was Sie vertont haben. Mit Speechgen werden nur neue oder geänderte Sätze vertont. Wie in der Tabelle zu sehen ist, hat Speechgen bei einer wiederholten Vertonung nur 25% der gesamten Zeichenanzahl anstelle von 100% verwendet, da 75% des Textes aus zuvor vertonten Inhalten stammten.
Das bedeutet, dass Sie sich bei der Überarbeitung Ihres Textes keine Gedanken über wiederholte Kosten machen müssen. Sie können später zu Ihrem Text zurückkehren und damit arbeiten.
Darüber hinaus wird ein Buchmodus für die schnellere Vertonung großer Texte verwendet, der große Textblöcke anstelle von Sätzen verarbeitet. Speechgen kann bis zu 2.000.000 Zeichen gleichzeitig vertonen, aber der wirtschaftliche Cache funktioniert bis zu 100.000 Zeichen.
Vertonte Sätze werden nur 1 Woche lang im Speicher gespeichert. Sie haben 7 Tage Zeit, das Voiceover zu ergänzen oder zu überarbeiten.
Zusätzlich werden in Ihrem Profil die vollständige Voiceover-Historie 30 Tage lang gespeichert. Das bedeutet, dass Sie innerhalb von 30 Tagen den Text und die Datei vollständig herunterladen können. Der Cache selbst wird jedoch nur 7 Tage lang gespeichert.
Wenn Sie sich beispielsweise nach 25 Tagen entscheiden, das Voiceover zu ergänzen, werden die Limits für das gesamte Projekt erneut abgezogen. Durch das Speichern des Voiceovers in den Favoriten können Sie die Audioaufnahme mit dem Text für immer behalten, aber der Cache wird trotzdem nur 7 Tage lang gespeichert.
Ihr Text und Ihre Audiodatei werden in Ihrem Profil gespeichert, aber nicht der Cache. Bitte beachten Sie dies bei der Arbeit.
Der Cache funktioniert nur für unveränderte Sätze. Wenn Sie auch nur einen Buchstaben ändern oder ein Komma in einem Satz entfernen, wird er vom System als neu betrachtet.
Originaltext:
Hinzufügen eines neuen Satzes:
Ergebnis: Speechgen nimmt die ersten drei Sätze aus dem Cache und vertont nur den vierten. Kosten fallen nur für den vierten Satz an.
Originaltext:
Ändern eines Wortes im zweiten Satz:
Ergebnis: Speechgen nimmt den ersten und dritten Satz aus dem Cache, vertont aber den zweiten Satz erneut.
Originaltext:
Entfernen der Kommas im dritten Satz:
Ergebnis: Speechgen vertont den dritten Satz neu und nimmt die ersten beiden Sätze aus dem Cache. Der dritte Satz wird aufgrund der Entfernung der Kommas als geändert betrachtet.
Wenn Sie ein neues Pausentag wie break hinzufügen, wird dies ebenfalls als Änderung des Satzes betrachtet. Das System analysiert und vertont ihn neu.
<break time="200ms"/>
Tatsächlich werden Sätze aus dem wirtschaftlichen Cache anhand einer vollständigen Übereinstimmung, Zeichen für Zeichen, abgerufen. Wenn ein neues Zeichen vorhanden ist oder ein Zeichen im Satz fehlt, kann das Programm es nicht exakt abgleichen.
Wenn Sie die Einstellungen für Geschwindigkeit oder Ton ändern, handelt es sich um eine komplett neue Vertonung, und der wirtschaftliche Cache funktioniert nicht. Wenn Sie die Geschwindigkeit oder den Ton ändern, vertont das neuronale Netzwerk den Text mit diesen neuen Parametern neu. Dies ist keine Software-Beschleunigung oder Tonänderung; es ist eine vollständige Neuvertonung.
Das Ändern des Sprechers führt ebenfalls zu einer vollständigen Neuvertonung. Hier leistet das neuronale Netzwerk die gesamte Arbeit erneut. Wenn Sie also die Stimme anpassen, tun Sie dies für 1-2 Sätze, und sobald Sie mit Geschwindigkeit und Ton zufrieden sind, vertonen Sie den gesamten gewünschten Text.
Auf dieser speziellen Seite https://speechgen.io/de/subs/ können Sie Untertitel vertonen. Um das Timing einzuhalten, ist es oft notwendig, die Sprache zu beschleunigen, um das erforderliche Timing zu erreichen. In diesem Fall funktioniert der wirtschaftliche Cache, da Speechgen zuerst vertont und dann programmatisch die Untertitel beschleunigt.
Sie können die Pausen in den Einstellungen unter dem Vertonungsfeld ändern, und der Cache funktioniert einwandfrei. Wir speichern ganze Sätze im Speicher, und das System fügt sie dann zu Audio zusammen. So können Sie Pausen zwischen Sätzen oder Absätzen ohne zusätzliche Kosten anpassen.
Wenn Sie ein anderes Format auswählen – ogg, wav, opus – und auf "Neu vertonen" klicken, berechnet das System keine Limits. Dies ist kostenlos. Wenn Sie vertont haben und dann festgestellt haben, dass Sie ein anderes Format benötigen, ändern Sie es, ohne doppelte Kosten befürchten zu müssen.
Wenn Sie die Abtastrate in den Einstellungen ändern und erneut auf "Neu vertonen" klicken, berechnet das System keine Limits. Dies ist kostenlos.
Das wirtschaftliche Caching-System von Speechgen bietet erhebliche Vorteile:
Speechgen spart Ihre Ressourcen und bietet Werkzeuge für eine effizientere Arbeit mit Audioinhalten, was es zur idealen Wahl für diejenigen macht, die Wert auf Effizienz und Qualität bei der Sprachsynthese legen.