27-10-2025 , 27-10-2025

Vereinfachen Sie die Erstellung von Sprachinhalten: Integration von SpeechGen.io mit Make.com. Dieser Blogbeitrag führt Sie durch die Integration des Automatisierungsdienstes Make.com (ehemals Integromat) mit unserem neuronalen Netzwerk-basierten Sprachsynthesedienst SpeechGen.io. Diese Integration ermöglicht die Automatisierung von Text-zu-Sprache-Prozessen, wodurch die Inhaltserstellung einfacher und effizienter wird.
Wir behandeln zwei Methoden, basierend auf der Länge des Textes, den Sie in Sprache umwandeln möchten:
Für Texte bis zu 2000 Zeichen: Diese Methode beinhaltet eine schnelle Anfrage und den sofortigen Empfang der Sprachausgabe. Sie ist perfekt für kurze Texte, die schnell konvertiert werden müssen.
Für Texte über 2000 Zeichen: Diese Methode verwendet zwei Anfragen. Die erste Anfrage sendet den Text mit Spracheinstellungen zur Konvertierung. Die zweite Anfrage, die frühestens eine Minute später erfolgen sollte, ruft die fertige Audiodatei ab. Dieser Ansatz stellt sicher, dass längere Texte effizient verarbeitet werden, ohne das System zu überlasten.
Make.com erleichtert die Automatisierung dieser Prozesse, ohne dass tiefgreifende technische Kenntnisse erforderlich sind. Sie können Auslöser einrichten, um den Text-zu-Sprache-Prozess automatisch zu starten, wenn bestimmte Bedingungen erfüllt sind, wie z.B. das Hinzufügen neuer Texte zu Ihrem CMS oder Ihrer Datenbank.
Um mit der Integration zu beginnen, müssen Sie sich mit unserer API vertraut machen. Alle notwendigen Informationen, einschließlich Dokumentation und FAQs, finden Sie unter SpeechGen.io API FAQ.
In diesem Blogbeitrag erfahren wir, wie man eine MP3-Datei aus Text mit SpeechGen generiert und diese MP3-Datei dann auf Dropbox hochlädt.
Sie können die Demo-Projekt-JSON herunterladen und importieren, die in diesem Blog gezeigt wird, und sie verwenden.

Melden Sie sich bei Make.com an und klicken Sie auf "Neues Szenario erstellen".


Suchen Sie nach "HTTP" und wählen Sie "HTTP" aus der Liste der verfügbaren Module.


Geben Sie die URL als https://speechgen.io/index.php?r=api/text ein.
Klicken Sie dann auf "Parameter hinzufügen", um Abfrageparameter zu unserer Anfrage hinzuzufügen.

Wir müssen insgesamt 4 Parameter eingeben, also fügen wir 3 weitere hinzu.



Jetzt ist es Zeit, Ihr Szenario auszuführen und zu testen.

Klicken Sie auf diese Blase, um das Ergebnis Ihrer Anfrage zu sehen.

Konzentrieren Sie sich auf den Ausgabeteil, Sie werden 'Data' sehen.
Sie sehen 'file', das ist die URL der generierten MP3-Datei unseres Textes.

Wenn Sie zu dieser URL navigieren, können Sie die MP3-Datei abspielen und herunterladen.
Um die Daten von SpeechGen für andere Module leicht zugänglich zu machen, können wir unserem Szenario ein weiteres Modul hinzufügen.
Fahren Sie mit der Maus neben das erste Modul, das wir haben, Sie sehen einen Plus-Button, klicken Sie darauf.

Suchen Sie nach 'JSON' und wählen Sie diese Option aus.

Wählen Sie dann "JSON parsen", damit wir die Daten von SpeechGen in mehrere Variablen exportieren können, die wir in unserem Szenario verwenden können.

Klicken Sie hier (JSON-String), um 'Data' aus dem vorherigen HTTP-Modul einzugeben.

Klicken Sie auf 'Data', um es dem Feld hinzuzufügen, und klicken Sie auf OK, um die Änderungen zu speichern.

Klicken Sie auf 'Einmal ausführen', um das Szenario auszuführen.

Wählen Sie 'Trotzdem ausführen', um Make zu zwingen, das Szenario auszuführen.

Dies liegt daran, dass JSON nicht das letzte Modul im Szenario sein sollte, da es die Daten von einem anderen Modul transformiert und wir in diesem Fall nichts mit diesen Daten tun. Wir möchten die Daten nur zuerst sehen und dann entscheiden, was damit zu tun ist.
Klicken Sie auf die Blase über dem JSON-Modul, um die erhaltenen Daten anzuzeigen.

Nun sind die Daten, die alle unter 'Data' waren, in einzelnen Variablen, die wir in den nächsten Modulen verwenden können...
Sie können auch die Variable 'file' bemerken, die die URL der generierten MP3-Datei enthielt, die wir im nächsten Modul verwenden werden.

Laden wir nun die generierte MP3-Datei auf Dropbox hoch. Dazu müssen wir die MP3-Datei zuerst in diesem Szenario herunterladen.

Wählen Sie Datei abrufen, damit wir die MP3-Datei innerhalb des Szenarios herunterladen können.

Die meisten Module benötigen nur die URL, aber Dropbox erfordert die direkte Eingabe der tatsächlichen Dateidaten.
Ordnen Sie die Variable 'file' zu, die die URL ist, die wir zum Abrufen der Datei verwenden können.

Dann fügen wir das Dropbox-Modul hinzu.


Wählen Sie den Ordner aus, in dem Sie in Ihrer Dropbox speichern möchten, und wählen Sie dann "Zuordnen", damit wir den Namen der hochgeladenen MP3-Datei ändern können.

Stellen Sie sicher, dass Sie die Dateierweiterung '.mp3' am Ende des Namens hinzufügen, damit Dropbox sie leichter als abspielbare MP3-Datei erkennen kann.

Nachdem das Szenario ausgeführt wurde, haben wir die Datei auf Dropbox hochgeladen.


Jetzt nutzen wir die SpeechGen Long Text API, um eine lange TTS zu generieren.
Die zweite Methode ist für Texte länger als 2000 Zeichen konzipiert. Im Gegensatz zur ersten Methode, die kurze Texte schnell in Sprache umwandelt, umfasst dieser Ansatz aufgrund der für längere Texte erforderlichen Verarbeitungszeit zwei Schritte.
Der Hauptunterschied zur ersten Methode ist die Notwendigkeit einer zweiten Anfrage aufgrund der längeren Verarbeitungszeit. Diese Methode gewährleistet eine effiziente Handhabung umfangreicher Texte und eignet sich daher für die Erstellung längerer Audioinhalte.
Dann laden wir die Datei als Demo auf Dropbox hoch, aber die Möglichkeiten, wie Sie diese TTS-API nutzen können, sind endlos.
Sie können die Demo-Blaupause für lange Texte als JSON herunterladen und importieren, die in diesem Blog gezeigt wird, und sie verwenden.

Melden Sie sich bei Make.com an und klicken Sie auf "Neues Szenario erstellen".


Suchen Sie nach "HTTP" und wählen Sie "HTTP" aus der Liste der verfügbaren Module.


Geben Sie die URL als https://speechgen.io/index.php?r=api/longtext ein.
Klicken Sie dann auf „Parameter hinzufügen“, um unserer Anfrage Abfrageparameter hinzuzufügen.

Wir müssen insgesamt 4 Parameter eingeben, also fügen wir 3 weitere hinzu.


Jetzt ist es Zeit, Ihr Szenario auszuführen und zu testen.

Klicken Sie auf diese Blase, um das Ergebnis Ihrer Anfrage zu sehen.

Konzentrieren Sie sich auf den Ausgabeteil. Sie sehen „Daten“.
Sie können „id“ sehen, das ist die ID unserer Anfrage.

Um die Daten von SpeechGen für andere Module leicht zugänglich zu machen, können wir unserem Szenario ein weiteres Modul hinzufügen.
Fahren Sie mit der Maus neben das erste Modul, das wir haben. Sie sehen einen Plus-Button, klicken Sie darauf.

Suchen Sie nach „JSON“ und wählen Sie diese Option aus.

Wählen Sie dann „JSON parsen“, damit wir die Daten von SpeechGen in mehrere Variablen exportieren können, die wir in unserem Szenario verwenden können.

Klicken Sie hier, um „Daten“ aus dem vorherigen HTTP-Modul einzugeben.

Klicken Sie auf „Daten“, um es dem Feld hinzuzufügen, und klicken Sie auf OK, um die Änderungen zu speichern.

Klicken Sie auf „Einmal ausführen“, um das Szenario auszuführen.

Wählen Sie „Trotzdem ausführen“, um Make zu zwingen, das Szenario auszuführen.

Dies liegt daran, dass JSON nicht das letzte Modul im Szenario sein sollte, da es die Daten von einem anderen Modul transformiert und wir in diesem Fall nichts mit diesen Daten tun. Wir möchten die Daten nur zuerst sehen und dann entscheiden, was wir damit machen.
Klicken Sie auf die Blase über dem JSON-Modul, um die erhaltenen Daten anzuzeigen.

Die Daten, die sich alle unter „Daten“ befanden, sind nun in einzelnen Variablen verfügbar, die wir in den nächsten Modulen verwenden können.
Sie können auch die Variable „ID“ bemerken, die wir in den nächsten Schritten verwenden werden, um die URL unserer TTS-Datei abzurufen.

Fügen Sie ein SLEEP-Modul hinzu, um auf die Generierung der TTS zu warten.


Stellen Sie die SLEEP-Dauer zwischen 1-5 Minuten (60-300 Sekunden) ein.
Für unsere Demo stellen wir sie auf 200 Sekunden ein.

Nun laden wir die generierte MP3-Datei auf Dropbox hoch. Dazu müssen wir die MP3-Datei zuerst in diesem Szenario herunterladen.
Fügen Sie ein weiteres HTTP-Modul hinzu, um die generierte TTS abzurufen.

Fügen Sie die notwendigen Parameter ein:

Führen Sie das Szenario aus, um die Daten abzurufen, und fügen Sie ein weiteres JSON-Parse-Modul hinzu.

Ordnen Sie „Daten“ aus dem vorherigen HTTP-Modul zu.
Führen Sie das Szenario noch einmal aus, um Daten aus dem letzten JSON-Parse-Modul zu erhalten, und fügen Sie dann ein weiteres HTTP-Modul hinzu, um die Datei herunterzuladen.

Wählen Sie „Datei abrufen“, damit wir die MP3-Datei innerhalb des Szenarios herunterladen können.

Die meisten Module benötigen nur die URL, aber Dropbox erfordert die direkte Eingabe der tatsächlichen Dateidaten.
Ordnen Sie die Variable „file“ zu, die die URL ist, die wir verwenden können, um die Datei abzurufen.



Wählen Sie den Ordner in Ihrer Dropbox aus, in dem gespeichert werden soll, und wählen Sie dann „Zuordnen“, damit wir den Namen der hochgeladenen MP3-Datei ändern können.

Stellen Sie sicher, dass Sie die Dateierweiterung „.mp3“ am Ende des Namens hinzufügen, damit Dropbox sie leichter als abspielbare MP3-Datei erkennt.

Nachdem das Szenario ausgeführt wurde, haben wir die Datei auf Dropbox hochgeladen.

Die Integration von SpeechGen.io mit Make.com eröffnet enorme Möglichkeiten zur Automatisierung der Erstellung von Sprachinhalten. Die Automatisierung der Sprachsynthese kann nützlich sein für:
Egal, ob Sie kurze Benachrichtigungen oder umfangreiche Bildungsmaterialien verarbeiten, unser Leitfaden hilft Ihnen, einen effizienten Prozess mit minimalem Aufwand einzurichten. Verwandeln Sie Ihren Text automatisch in lebendige Sprache und machen Sie Ihre Inhalte für ein breites Publikum zugänglicher und ansprechender.