SpeechGen API-Integration mit Make.com: Automatisieren Sie Text-zu-Sprache-Workflows

, 27-10-2025

Vereinfachen Sie die Erstellung von Sprachinhalten: Integration von SpeechGen.io mit Make.com. Dieser Blogbeitrag führt Sie durch die Integration des Automatisierungsdienstes Make.com (ehemals Integromat) mit unserem neuronalen Netzwerk-basierten Sprachsynthesedienst SpeechGen.io. Diese Integration ermöglicht die Automatisierung von Text-zu-Sprache-Prozessen, wodurch die Inhaltserstellung einfacher und effizienter wird.

So funktioniert es

Wir behandeln zwei Methoden, basierend auf der Länge des Textes, den Sie in Sprache umwandeln möchten:

  1. Für Texte bis zu 2000 Zeichen: Diese Methode beinhaltet eine schnelle Anfrage und den sofortigen Empfang der Sprachausgabe. Sie ist perfekt für kurze Texte, die schnell konvertiert werden müssen.

  2. Für Texte über 2000 Zeichen: Diese Methode verwendet zwei Anfragen. Die erste Anfrage sendet den Text mit Spracheinstellungen zur Konvertierung. Die zweite Anfrage, die frühestens eine Minute später erfolgen sollte, ruft die fertige Audiodatei ab. Dieser Ansatz stellt sicher, dass längere Texte effizient verarbeitet werden, ohne das System zu überlasten.

Warum Make.com verwenden?

Make.com erleichtert die Automatisierung dieser Prozesse, ohne dass tiefgreifende technische Kenntnisse erforderlich sind. Sie können Auslöser einrichten, um den Text-zu-Sprache-Prozess automatisch zu starten, wenn bestimmte Bedingungen erfüllt sind, wie z.B. das Hinzufügen neuer Texte zu Ihrem CMS oder Ihrer Datenbank.

Erste Schritte

Um mit der Integration zu beginnen, müssen Sie sich mit unserer API vertraut machen. Alle notwendigen Informationen, einschließlich Dokumentation und FAQs, finden Sie unter SpeechGen.io API FAQ.

Vollständige Videoanleitung

1. Methode für kurze Texte

In diesem Blogbeitrag erfahren wir, wie man eine MP3-Datei aus Text mit SpeechGen generiert und diese MP3-Datei dann auf Dropbox hochlädt.

Sie können die Demo-Projekt-JSON herunterladen und importieren, die in diesem Blog gezeigt wird, und sie verwenden.

1. Voraussetzungen

2. Holen Sie sich Ihren SpeechGen API-Schlüssel

  1. Melden Sie sich bei Ihrem SpeechGen.io-Profil an
  2. Navigieren Sie zu Ihrem Profil
  3. Zeigen Sie Ihren API-Schlüssel an und kopieren Sie ihn. Wir werden ihn später verwenden.

Speechgen API Key

3. Erstellen Sie ein neues Szenario

Melden Sie sich bei Make.com an und klicken Sie auf "Neues Szenario erstellen".

Neues Szenario erstellen

4. Fügen Sie ein neues Modul hinzu

Neues Modul hinzufügen

5. HTTP auswählen

Suchen Sie nach "HTTP" und wählen Sie "HTTP" aus der Liste der verfügbaren Module.

HTTP aus der Liste auswählen

6. Wählen Sie "Anfrage stellen"

Anfrage stellen auswählen

7. URL eingeben

Geben Sie die URL als https://speechgen.io/index.php?r=api/text ein.

Klicken Sie dann auf "Parameter hinzufügen", um Abfrageparameter zu unserer Anfrage hinzuzufügen.

URL eingeben

8. Fügen Sie 3 weitere Parameter ein

Wir müssen insgesamt 4 Parameter eingeben, also fügen wir 3 weitere hinzu.

3 weitere Parameter hinzufügen

9. Geben Sie die erforderlichen Parameter ein

Erforderliche Parameter eingeben

  • token = Der API-Token, den Sie in Schritt 2 kopiert haben
  • email = Die E-Mail-Adresse, die mit Ihrem SpeechGen-Konto verknüpft ist
  • voice = Der genaue Name der Stimme. Sie können die gewünschte Stimme aus der vollständigen Stimmenliste auswählen und den Namen der Stimme von dort kopieren. JSON API-Stimmen https://speechgen.io/index.php?r=api/voices.
  • text = Der Text, den Sie in Sprache umwandeln möchten. Als Beispiel füge ich diesen Text ein: "Eine praktische Lösung zum Erstellen von Voiceovers, E-Learning-Materialien und Werbung. Generieren Sie Sprache aus Text in mehreren Sprachen und Akzenten. Passen Sie die Spracheinstellungen an spezifische Bedürfnisse an.".

10. Klicken Sie auf OK, um die Änderungen zu speichern

OK, um die Änderungen zu speichern

11. Führen Sie Ihr Szenario aus

Jetzt ist es Zeit, Ihr Szenario auszuführen und zu testen.

Führen Sie Ihr Szenario aus

12. Klicken Sie auf die Blase

Klicken Sie auf diese Blase, um das Ergebnis Ihrer Anfrage zu sehen.

Klicken Sie auf die Blase

Konzentrieren Sie sich auf den Ausgabeteil, Sie werden 'Data' sehen.

Sie sehen 'file', das ist die URL der generierten MP3-Datei unseres Textes.

generierte MP3-Datei

Wenn Sie zu dieser URL navigieren, können Sie die MP3-Datei abspielen und herunterladen.

Um die Daten von SpeechGen für andere Module leicht zugänglich zu machen, können wir unserem Szenario ein weiteres Modul hinzufügen.

14. Fügen Sie ein weiteres Modul hinzu

Fahren Sie mit der Maus neben das erste Modul, das wir haben, Sie sehen einen Plus-Button, klicken Sie darauf.

nächstes Modul

15. Wählen Sie die Option 'JSON'

Suchen Sie nach 'JSON' und wählen Sie diese Option aus.

JSON auswählen

16. Wählen Sie "JSON parsen"

Wählen Sie dann "JSON parsen", damit wir die Daten von SpeechGen in mehrere Variablen exportieren können, die wir in unserem Szenario verwenden können.

JSON parsen auswählen

17. Geben Sie 'Data' ein

Klicken Sie hier (JSON-String), um 'Data' aus dem vorherigen HTTP-Modul einzugeben.

Daten eingeben

18. Klicken Sie auf 'Data'

Klicken Sie auf 'Data', um es dem Feld hinzuzufügen, und klicken Sie auf OK, um die Änderungen zu speichern.

Auf Daten klicken

19. Einmal ausführen

Klicken Sie auf 'Einmal ausführen', um das Szenario auszuführen.

Klicken Sie auf 'Einmal ausführen', um das Szenario auszuführen

Wählen Sie 'Trotzdem ausführen', um Make zu zwingen, das Szenario auszuführen.

Trotzdem ausführen

Dies liegt daran, dass JSON nicht das letzte Modul im Szenario sein sollte, da es die Daten von einem anderen Modul transformiert und wir in diesem Fall nichts mit diesen Daten tun. Wir möchten die Daten nur zuerst sehen und dann entscheiden, was damit zu tun ist.

20. Klicken Sie auf die Blase

Klicken Sie auf die Blase über dem JSON-Modul, um die erhaltenen Daten anzuzeigen.

Klicken Sie auf die Blase über dem JSON-Modul

Nun sind die Daten, die alle unter 'Data' waren, in einzelnen Variablen, die wir in den nächsten Modulen verwenden können...

Sie können auch die Variable 'file' bemerken, die die URL der generierten MP3-Datei enthielt, die wir im nächsten Modul verwenden werden.

Beachten Sie die Datei

Laden wir nun die generierte MP3-Datei auf Dropbox hoch. Dazu müssen wir die MP3-Datei zuerst in diesem Szenario herunterladen.

21. Fügen Sie ein weiteres HTTP-Modul hinzu, um die Datei herunterzuladen

Fügen Sie ein weiteres HTTP-Modul hinzu

Wählen Sie Datei abrufen, damit wir die MP3-Datei innerhalb des Szenarios herunterladen können.

Datei abrufen auswählen

Die meisten Module benötigen nur die URL, aber Dropbox erfordert die direkte Eingabe der tatsächlichen Dateidaten.

22. Ordnen Sie die Variable 'file' zu

Ordnen Sie die Variable 'file' zu, die die URL ist, die wir zum Abrufen der Datei verwenden können.

Die Dateivariable zuordnen

23. Dropbox-Modul

Dann fügen wir das Dropbox-Modul hinzu.

Dropbox-Modul

24. Wählen Sie "Datei hochladen"

Datei hochladen auswählen

Wählen Sie den Ordner aus, in dem Sie in Ihrer Dropbox speichern möchten, und wählen Sie dann "Zuordnen", damit wir den Namen der hochgeladenen MP3-Datei ändern können.

Datei

Stellen Sie sicher, dass Sie die Dateierweiterung '.mp3' am Ende des Namens hinzufügen, damit Dropbox sie leichter als abspielbare MP3-Datei erkennen kann.

MP3-Datei

Nachdem das Szenario ausgeführt wurde, haben wir die Datei auf Dropbox hochgeladen.

Die Datei wurde auf Dropbox hochgeladen

Kompletter Prozess für die 1. Methode

Eine Vorschau des gesamten Prozesses

  1. HTTP: Generieren Sie das Audio aus Text mit SpeechGen.io
  2. JSON: Parsen Sie die Daten, die wir von der SpeechGen API erhalten
  3. HTTP: Holen Sie sich die Binärdaten der generierten Datei
  4. Dropbox: Laden Sie diese Daten auf Dropbox hoch

2. Methode für lange Texte

Jetzt nutzen wir die SpeechGen Long Text API, um eine lange TTS zu generieren.

Die zweite Methode ist für Texte länger als 2000 Zeichen konzipiert. Im Gegensatz zur ersten Methode, die kurze Texte schnell in Sprache umwandelt, umfasst dieser Ansatz aufgrund der für längere Texte erforderlichen Verarbeitungszeit zwei Schritte.

  1. Erste Anfrage: Sie senden den Text mit den gewählten Spracheinstellungen, um den Konvertierungsprozess zu starten.
  2. Folgeanfrage: Nach einer Wartezeit von mindestens einer Minute stellen Sie eine weitere Anfrage, um die fertige Audiodatei abzurufen. Diese Verzögerung stellt sicher, dass das System genügend Zeit hat, den längeren Text ohne Probleme zu verarbeiten.

Der Hauptunterschied zur ersten Methode ist die Notwendigkeit einer zweiten Anfrage aufgrund der längeren Verarbeitungszeit. Diese Methode gewährleistet eine effiziente Handhabung umfangreicher Texte und eignet sich daher für die Erstellung längerer Audioinhalte.

Dann laden wir die Datei als Demo auf Dropbox hoch, aber die Möglichkeiten, wie Sie diese TTS-API nutzen können, sind endlos.

Sie können die Demo-Blaupause für lange Texte als JSON herunterladen und importieren, die in diesem Blog gezeigt wird, und sie verwenden.

1. Voraussetzungen

2. Holen Sie sich Ihren SpeechGen API-Schlüssel

  1. Melden Sie sich bei Ihrem SpeechGen.io-Profil an
  2. Navigieren Sie zu Ihrem Profil
  3. Zeigen Sie Ihren API-Schlüssel an und kopieren Sie ihn. Wir werden ihn später verwenden.

Speechgen API Key

3. Erstellen Sie ein neues Szenario

Melden Sie sich bei Make.com an und klicken Sie auf "Neues Szenario erstellen".

Neues Szenario erstellen

4. Fügen Sie ein neues Modul hinzu

Neues Modul hinzufügen

5. HTTP auswählen

Suchen Sie nach "HTTP" und wählen Sie "HTTP" aus der Liste der verfügbaren Module.

Wählen Sie HTTP aus der Liste

6. Wählen Sie „Anfrage stellen“

Wählen Sie „Anfrage stellen“

7. URL eingeben

Geben Sie die URL als https://speechgen.io/index.php?r=api/longtext ein.

Klicken Sie dann auf „Parameter hinzufügen“, um unserer Anfrage Abfrageparameter hinzuzufügen.

URL eingeben

8. Geben Sie 4 Parameter ein

Wir müssen insgesamt 4 Parameter eingeben, also fügen wir 3 weitere hinzu.

3 weitere Parameter hinzufügen

9. Geben Sie die erforderlichen Parameter ein

Geben Sie die erforderlichen Parameter ein

  • token = Der API-Token, den Sie aus Schritt 2 kopiert haben.
  • email = Die E-Mail-Adresse, die mit Ihrem SpeechGen-Konto aus Schritt 2 verknüpft ist.
  • voice = Der genaue Name der Stimme. Sie können die gewünschte Stimme aus der vollständigen Stimmenliste auswählen und den Namen der Stimme von dort kopieren. JSON API-Stimmen: https://speechgen.io/index.php?r=api/voices.
  • text = Der Text, den Sie in Sprache umwandeln möchten.

10. Klicken Sie auf OK, um die Änderungen zu speichern

11. Ausführen

Jetzt ist es Zeit, Ihr Szenario auszuführen und zu testen.

Führen Sie Ihr Szenario aus

12. Klicken Sie auf die Blase

Klicken Sie auf diese Blase, um das Ergebnis Ihrer Anfrage zu sehen.

Klicken Sie auf die Blase

Konzentrieren Sie sich auf den Ausgabeteil. Sie sehen „Daten“.

Sie können „id“ sehen, das ist die ID unserer Anfrage.

Datei-ID

Um die Daten von SpeechGen für andere Module leicht zugänglich zu machen, können wir unserem Szenario ein weiteres Modul hinzufügen.

13. Ein weiteres Modul hinzufügen

Fahren Sie mit der Maus neben das erste Modul, das wir haben. Sie sehen einen Plus-Button, klicken Sie darauf.

Nächstes Modul

14. JSON hinzufügen

Suchen Sie nach „JSON“ und wählen Sie diese Option aus.

JSON auswählen

Wählen Sie dann „JSON parsen“, damit wir die Daten von SpeechGen in mehrere Variablen exportieren können, die wir in unserem Szenario verwenden können.

JSON parsen auswählen

15. „Daten“ eingeben

Klicken Sie hier, um „Daten“ aus dem vorherigen HTTP-Modul einzugeben.

Daten eingeben

16. Klicken Sie auf „Daten“

Klicken Sie auf „Daten“, um es dem Feld hinzuzufügen, und klicken Sie auf OK, um die Änderungen zu speichern.

Auf Daten klicken

17. Einmal ausführen

Klicken Sie auf „Einmal ausführen“, um das Szenario auszuführen.

Klicken Sie auf „Einmal ausführen“, um das Szenario auszuführen

Wählen Sie „Trotzdem ausführen“, um Make zu zwingen, das Szenario auszuführen.

Trotzdem ausführen

Dies liegt daran, dass JSON nicht das letzte Modul im Szenario sein sollte, da es die Daten von einem anderen Modul transformiert und wir in diesem Fall nichts mit diesen Daten tun. Wir möchten die Daten nur zuerst sehen und dann entscheiden, was wir damit machen.

18. Klicken Sie auf die Blase

Klicken Sie auf die Blase über dem JSON-Modul, um die erhaltenen Daten anzuzeigen.

Klicken Sie auf die Blase über dem JSON-Modul

Die Daten, die sich alle unter „Daten“ befanden, sind nun in einzelnen Variablen verfügbar, die wir in den nächsten Modulen verwenden können.

Sie können auch die Variable „ID“ bemerken, die wir in den nächsten Schritten verwenden werden, um die URL unserer TTS-Datei abzurufen.

TTS-Datei-URL

19. Ein SLEEP-Modul hinzufügen

Fügen Sie ein SLEEP-Modul hinzu, um auf die Generierung der TTS zu warten.

Schlaf

Klicken Sie auf SLEEP

20. SLEEP einstellen

Stellen Sie die SLEEP-Dauer zwischen 1-5 Minuten (60-300 Sekunden) ein.

Für unsere Demo stellen wir sie auf 200 Sekunden ein.

SLEEP-Dauer einstellen

Nun laden wir die generierte MP3-Datei auf Dropbox hoch. Dazu müssen wir die MP3-Datei zuerst in diesem Szenario herunterladen.

21. Ein weiteres HTTP-Modul hinzufügen

Fügen Sie ein weiteres HTTP-Modul hinzu, um die generierte TTS abzurufen.

Die generierte TTS abrufen

Fügen Sie die notwendigen Parameter ein:

  • token = Der API-Token, den Sie aus Schritt 2 kopiert haben.
  • email = Die E-Mail-Adresse, die mit Ihrem SpeechGen-Konto aus Schritt 2 verknüpft ist.
  • id = Die ID der TTS aus der ersten Anfrage [JSON parsen, Schritt 2].

22. Die ID aus dem JSON-Modul zuordnen

Die ID aus dem JSON-Modul zuordnen

23. Daten abrufen

Führen Sie das Szenario aus, um die Daten abzurufen, und fügen Sie ein weiteres JSON-Parse-Modul hinzu.

JSON-Parse-Modul

Ordnen Sie „Daten“ aus dem vorherigen HTTP-Modul zu.

23. Führen Sie das Szenario noch einmal aus

Führen Sie das Szenario noch einmal aus, um Daten aus dem letzten JSON-Parse-Modul zu erhalten, und fügen Sie dann ein weiteres HTTP-Modul hinzu, um die Datei herunterzuladen.

Ein weiteres HTTP-Modul hinzufügen

24. Wählen Sie „Datei abrufen“

Wählen Sie „Datei abrufen“, damit wir die MP3-Datei innerhalb des Szenarios herunterladen können.

Datei abrufen auswählen

Die meisten Module benötigen nur die URL, aber Dropbox erfordert die direkte Eingabe der tatsächlichen Dateidaten.

25. Die Variable „file“ zuordnen

Ordnen Sie die Variable „file“ zu, die die URL ist, die wir verwenden können, um die Datei abzurufen.

Die Dateivariable zuordnen

26. Dann fügen wir das Dropbox-Modul hinzu

Dropbox-Modul

27. Datei hochladen auswählen

Datei hochladen auswählen

Wählen Sie den Ordner in Ihrer Dropbox aus, in dem gespeichert werden soll, und wählen Sie dann „Zuordnen“, damit wir den Namen der hochgeladenen MP3-Datei ändern können.

Datei

Stellen Sie sicher, dass Sie die Dateierweiterung „.mp3“ am Ende des Namens hinzufügen, damit Dropbox sie leichter als abspielbare MP3-Datei erkennt.

MP3-Datei

Nachdem das Szenario ausgeführt wurde, haben wir die Datei auf Dropbox hochgeladen.

Die Datei wurde auf Dropbox hochgeladen

Kompletter Prozess für eine 2-D-Methode

Schema des Prozesses

  1. HTTP: Audio aus Text mit SpeechGen.io generieren.
  2. JSON: Die Daten, die wir von der SpeechGen API erhalten, parsen.
  3. SLEEP: Einige Minuten warten, bis die TTS bereit ist.
  4. HTTP: Die MP3-Datei mit ihrer ID anfordern.
  5. JSON: Die Daten wie zuvor parsen.
  6. HTTP: Binäre Daten der generierten Datei abrufen.
  7. Dropbox: Diese Daten auf Dropbox hochladen.

Fazit

Die Integration von SpeechGen.io mit Make.com eröffnet enorme Möglichkeiten zur Automatisierung der Erstellung von Sprachinhalten. Die Automatisierung der Sprachsynthese kann nützlich sein für:

  • Erstellung von Audioversionen von Artikeln oder Blogs.
  • Generierung von Sprachbenachrichtigungen für Kunden.
  • Produktion von Bildungs- und Schulungsmaterialien im Audioformat.
  • Verbesserung des Kundenservice durch Sprachantworten.

Egal, ob Sie kurze Benachrichtigungen oder umfangreiche Bildungsmaterialien verarbeiten, unser Leitfaden hilft Ihnen, einen effizienten Prozess mit minimalem Aufwand einzurichten. Verwandeln Sie Ihren Text automatisch in lebendige Sprache und machen Sie Ihre Inhalte für ein breites Publikum zugänglicher und ansprechender.

Wir benutzen Cookies, um Ihnen das beste Erlebnis auf der Website zu bieten. Mehr Informationen: Privacy Policy

Cookies akzeptieren