SpeechGen API-Integration mit Make.com: Automatisieren Sie Text-zu-Sprache-Workflows

27-10-2025 , 27-10-2025

Vereinfachen Sie die Erstellung von Sprachinhalten: Integration von SpeechGen.io mit Make.com. Dieser Blogbeitrag führt Sie durch die Integration des Automatisierungsdienstes Make.com (ehemals Integromat) mit unserem neuronalen Netzwerk-basierten Sprachsynthesedienst SpeechGen.io. Diese Integration ermöglicht die Automatisierung von Text-zu-Sprache-Prozessen, wodurch die Inhaltserstellung einfacher und effizienter wird.

So funktioniert es

Wir behandeln zwei Methoden, basierend auf der Länge des Textes, den Sie in Sprache umwandeln möchten:

Für Texte bis zu 2000 Zeichen: Diese Methode beinhaltet eine schnelle Anfrage und den sofortigen Empfang der Sprachausgabe. Sie ist perfekt für kurze Texte, die schnell konvertiert werden müssen.
Für Texte über 2000 Zeichen: Diese Methode verwendet zwei Anfragen. Die erste Anfrage sendet den Text mit Spracheinstellungen zur Konvertierung. Die zweite Anfrage, die frühestens eine Minute später erfolgen sollte, ruft die fertige Audiodatei ab. Dieser Ansatz stellt sicher, dass längere Texte effizient verarbeitet werden, ohne das System zu überlasten.

Warum Make.com verwenden?

Make.com erleichtert die Automatisierung dieser Prozesse, ohne dass tiefgreifende technische Kenntnisse erforderlich sind. Sie können Auslöser einrichten, um den Text-zu-Sprache-Prozess automatisch zu starten, wenn bestimmte Bedingungen erfüllt sind, wie z.B. das Hinzufügen neuer Texte zu Ihrem CMS oder Ihrer Datenbank.

Erste Schritte

Um mit der Integration zu beginnen, müssen Sie sich mit unserer API vertraut machen. Alle notwendigen Informationen, einschließlich Dokumentation und FAQs, finden Sie unter SpeechGen.io API FAQ.

Vollständige Videoanleitung

1. Methode für kurze Texte

In diesem Blogbeitrag erfahren wir, wie man eine MP3-Datei aus Text mit SpeechGen generiert und diese MP3-Datei dann auf Dropbox hochlädt.

Sie können die Demo-Projekt-JSON herunterladen und importieren, die in diesem Blog gezeigt wird, und sie verwenden.

1. Voraussetzungen

2. Holen Sie sich Ihren SpeechGen API-Schlüssel

Melden Sie sich bei Ihrem SpeechGen.io-Profil an
Navigieren Sie zu Ihrem Profil
Zeigen Sie Ihren API-Schlüssel an und kopieren Sie ihn. Wir werden ihn später verwenden.

Speechgen API Key

3. Erstellen Sie ein neues Szenario

Melden Sie sich bei Make.com an und klicken Sie auf "Neues Szenario erstellen".

Neues Szenario erstellen

4. Fügen Sie ein neues Modul hinzu

Neues Modul hinzufügen

5. HTTP auswählen

Suchen Sie nach "HTTP" und wählen Sie "HTTP" aus der Liste der verfügbaren Module.

HTTP aus der Liste auswählen

6. Wählen Sie "Anfrage stellen"

Anfrage stellen auswählen

7. URL eingeben

Geben Sie die URL als https://speechgen.io/index.php?r=api/text ein.

Klicken Sie dann auf "Parameter hinzufügen", um Abfrageparameter zu unserer Anfrage hinzuzufügen.

URL eingeben

8. Fügen Sie 3 weitere Parameter ein

Wir müssen insgesamt 4 Parameter eingeben, also fügen wir 3 weitere hinzu.

3 weitere Parameter hinzufügen

9. Geben Sie die erforderlichen Parameter ein

Erforderliche Parameter eingeben

token = Der API-Token, den Sie in Schritt 2 kopiert haben
email = Die E-Mail-Adresse, die mit Ihrem SpeechGen-Konto verknüpft ist
voice = Der genaue Name der Stimme. Sie können die gewünschte Stimme aus der vollständigen Stimmenliste auswählen und den Namen der Stimme von dort kopieren. JSON API-Stimmen https://speechgen.io/index.php?r=api/voices.
text = Der Text, den Sie in Sprache umwandeln möchten. Als Beispiel füge ich diesen Text ein: "Eine praktische Lösung zum Erstellen von Voiceovers, E-Learning-Materialien und Werbung. Generieren Sie Sprache aus Text in mehreren Sprachen und Akzenten. Passen Sie die Spracheinstellungen an spezifische Bedürfnisse an.".

10. Klicken Sie auf OK, um die Änderungen zu speichern

OK, um die Änderungen zu speichern

11. Führen Sie Ihr Szenario aus

Jetzt ist es Zeit, Ihr Szenario auszuführen und zu testen.

Führen Sie Ihr Szenario aus

12. Klicken Sie auf die Blase

Klicken Sie auf diese Blase, um das Ergebnis Ihrer Anfrage zu sehen.

Klicken Sie auf die Blase

Konzentrieren Sie sich auf den Ausgabeteil, Sie werden 'Data' sehen.

Sie sehen 'file', das ist die URL der generierten MP3-Datei unseres Textes.

generierte MP3-Datei

Wenn Sie zu dieser URL navigieren, können Sie die MP3-Datei abspielen und herunterladen.

Um die Daten von SpeechGen für andere Module leicht zugänglich zu machen, können wir unserem Szenario ein weiteres Modul hinzufügen.

14. Fügen Sie ein weiteres Modul hinzu

Fahren Sie mit der Maus neben das erste Modul, das wir haben, Sie sehen einen Plus-Button, klicken Sie darauf.

nächstes Modul

15. Wählen Sie die Option 'JSON'

Suchen Sie nach 'JSON' und wählen Sie diese Option aus.

JSON auswählen

16. Wählen Sie "JSON parsen"

Wählen Sie dann "JSON parsen", damit wir die Daten von SpeechGen in mehrere Variablen exportieren können, die wir in unserem Szenario verwenden können.

JSON parsen auswählen

17. Geben Sie 'Data' ein

Klicken Sie hier (JSON-String), um 'Data' aus dem vorherigen HTTP-Modul einzugeben.

Daten eingeben

18. Klicken Sie auf 'Data'

Klicken Sie auf 'Data', um es dem Feld hinzuzufügen, und klicken Sie auf OK, um die Änderungen zu speichern.

Auf Daten klicken

19. Einmal ausführen

Klicken Sie auf 'Einmal ausführen', um das Szenario auszuführen.

Klicken Sie auf 'Einmal ausführen', um das Szenario auszuführen

Wählen Sie 'Trotzdem ausführen', um Make zu zwingen, das Szenario auszuführen.

Trotzdem ausführen

Dies liegt daran, dass JSON nicht das letzte Modul im Szenario sein sollte, da es die Daten von einem anderen Modul transformiert und wir in diesem Fall nichts mit diesen Daten tun. Wir möchten die Daten nur zuerst sehen und dann entscheiden, was damit zu tun ist.

20. Klicken Sie auf die Blase

Klicken Sie auf die Blase über dem JSON-Modul, um die erhaltenen Daten anzuzeigen.

Klicken Sie auf die Blase über dem JSON-Modul

Nun sind die Daten, die alle unter 'Data' waren, in einzelnen Variablen, die wir in den nächsten Modulen verwenden können...

Sie können auch die Variable 'file' bemerken, die die URL der generierten MP3-Datei enthielt, die wir im nächsten Modul verwenden werden.

Beachten Sie die Datei

Laden wir nun die generierte MP3-Datei auf Dropbox hoch. Dazu müssen wir die MP3-Datei zuerst in diesem Szenario herunterladen.

21. Fügen Sie ein weiteres HTTP-Modul hinzu, um die Datei herunterzuladen

Fügen Sie ein weiteres HTTP-Modul hinzu

Wählen Sie Datei abrufen, damit wir die MP3-Datei innerhalb des Szenarios herunterladen können.

Datei abrufen auswählen

Die meisten Module benötigen nur die URL, aber Dropbox erfordert die direkte Eingabe der tatsächlichen Dateidaten.

22. Ordnen Sie die Variable 'file' zu

Ordnen Sie die Variable 'file' zu, die die URL ist, die wir zum Abrufen der Datei verwenden können.

Die Dateivariable zuordnen

23. Dropbox-Modul

Dann fügen wir das Dropbox-Modul hinzu.

Dropbox-Modul

24. Wählen Sie "Datei hochladen"

Datei hochladen auswählen

Wählen Sie den Ordner aus, in dem Sie in Ihrer Dropbox speichern möchten, und wählen Sie dann "Zuordnen", damit wir den Namen der hochgeladenen MP3-Datei ändern können.

Datei

Stellen Sie sicher, dass Sie die Dateierweiterung '.mp3' am Ende des Namens hinzufügen, damit Dropbox sie leichter als abspielbare MP3-Datei erkennen kann.

MP3-Datei

Nachdem das Szenario ausgeführt wurde, haben wir die Datei auf Dropbox hochgeladen.

Die Datei wurde auf Dropbox hochgeladen

Kompletter Prozess für die 1. Methode

Eine Vorschau des gesamten Prozesses

HTTP: Generieren Sie das Audio aus Text mit SpeechGen.io
JSON: Parsen Sie die Daten, die wir von der SpeechGen API erhalten
HTTP: Holen Sie sich die Binärdaten der generierten Datei
Dropbox: Laden Sie diese Daten auf Dropbox hoch

2. Methode für lange Texte

Jetzt nutzen wir die SpeechGen Long Text API, um eine lange TTS zu generieren.

Die zweite Methode ist für Texte länger als 2000 Zeichen konzipiert. Im Gegensatz zur ersten Methode, die kurze Texte schnell in Sprache umwandelt, umfasst dieser Ansatz aufgrund der für längere Texte erforderlichen Verarbeitungszeit zwei Schritte.

Erste Anfrage: Sie senden den Text mit den gewählten Spracheinstellungen, um den Konvertierungsprozess zu starten.
Folgeanfrage: Nach einer Wartezeit von mindestens einer Minute stellen Sie eine weitere Anfrage, um die fertige Audiodatei abzurufen. Diese Verzögerung stellt sicher, dass das System genügend Zeit hat, den längeren Text ohne Probleme zu verarbeiten.

Der Hauptunterschied zur ersten Methode ist die Notwendigkeit einer zweiten Anfrage aufgrund der längeren Verarbeitungszeit. Diese Methode gewährleistet eine effiziente Handhabung umfangreicher Texte und eignet sich daher für die Erstellung längerer Audioinhalte.

Dann laden wir die Datei als Demo auf Dropbox hoch, aber die Möglichkeiten, wie Sie diese TTS-API nutzen können, sind endlos.

Sie können die Demo-Blaupause für lange Texte als JSON herunterladen und importieren, die in diesem Blog gezeigt wird, und sie verwenden.