Integracja API SpeechGen z Make.com: Automatyzacja procesów zamiany tekstu na mowę

27-10-2025 , 27-10-2025

Uprość tworzenie treści głosowych: Integracja SpeechGen.io z Make.com. Ten wpis na blogu przeprowadzi Cię przez proces integracji usługi automatyzacji Make.com (dawniej Integromat) z naszą usługą syntezy mowy opartą na sieciach neuronowych, SpeechGen.io. Ta integracja umożliwia automatyzację procesów zamiany tekstu na mowę, co ułatwia i usprawnia tworzenie treści.

Jak to działa

Opisujemy dwie metody, w zależności od długości tekstu, który chcesz zamienić na mowę:

Dla tekstów do 2000 znaków: Ta metoda polega na szybkim żądaniu i natychmiastowym otrzymaniu wyjścia mowy. Jest idealna do krótkich tekstów, które muszą być szybko przekonwertowane.
Dla tekstów powyżej 2000 znaków: Ta metoda wykorzystuje dwa żądania. Pierwsze żądanie wysyła tekst z ustawieniami głosu do konwersji. Drugie żądanie, które powinno być wykonane nie wcześniej niż minutę później, pobiera gotowy plik audio. Takie podejście zapewnia efektywne przetwarzanie dłuższych tekstów bez przeciążania systemu.

Dlaczego warto używać Make.com?

Make.com ułatwia automatyzację tych procesów bez potrzeby posiadania głębokiej wiedzy technicznej. Możesz ustawić wyzwalacze, aby automatycznie uruchamiać proces zamiany tekstu na mowę, gdy spełnione zostaną określone warunki, takie jak dodanie nowego tekstu do Twojego CMS lub bazy danych.

Rozpoczęcie pracy

Aby rozpocząć integrację, musisz zapoznać się z naszym API. Wszystkie niezbędne informacje, w tym dokumentację i często zadawane pytania, znajdziesz na stronie SpeechGen.io API FAQ.

Pełny przewodnik wideo

1. Metoda dla krótkich tekstów

W tym wpisie na blogu nauczymy się, jak wygenerować plik MP3 z tekstu za pomocą SpeechGen, a następnie przesłać ten plik MP3 do DropBoxa.

Możesz pobrać i zaimportować plik JSON z demonstracyjnym projektem, pokazanym w tym blogu i go użyć.

1. Wymagania

2. Uzyskaj swój klucz API SpeechGen

Zaloguj się do swojego profilu SpeechGen.io
Przejdź do swojego profilu
Odkryj i skopiuj swój klucz API. Użyjemy go później.

Speechgen API Key

3. Utwórz nowy scenariusz

Zaloguj się do Make.com i kliknij "Utwórz nowy scenariusz".

Utwórz nowy scenariusz

4. Dodaj nowy moduł

Dodaj nowy moduł

5. Wybierz HTTP

Wyszukaj "HTTP" i wybierz "HTTP" z listy dostępnych modułów.

Wybierz HTTP z listy

6. Wybierz opcję "Wykonaj żądanie"

Wybierz opcję Wykonaj żądanie

7. Wprowadź adres URL

Wprowadź adres URL jako https://speechgen.io/index.php?r=api/text

Następnie kliknij "Dodaj parametr", aby dodać parametry zapytania do naszego żądania.

Wprowadź adres URL

8. Wstaw jeszcze 3 parametry

Musimy wprowadzić łącznie 4 parametry, więc dodajmy jeszcze 3.

Dodaj jeszcze 3 parametry

9. Wprowadź wymagane parametry

Wprowadź wymagane parametry

token = Klucz API skopiowany z kroku 2
email = Adres e-mail powiązany z Twoim kontem SpeechGen
voice = Dokładna nazwa głosu. Możesz wybrać głos, który Ci się podoba, z pełnej listy głosów i skopiować jego nazwę stamtąd. Głosy API JSON https://speechgen.io/index.php?r=api/voices.
text = Tekst, który chcesz zamienić na mowę. Na przykład, wkleję taki tekst: "Praktyczne rozwiązanie do tworzenia lektorów, materiałów e-learningowych i reklam. Generuj mowę z tekstu w wielu językach i akcentach. Dostosuj ustawienia głosu do konkretnych potrzeb".

10. Kliknij OK, aby zapisać zmiany

OK, aby zapisać zmiany

11. Uruchom swój scenariusz

Teraz czas uruchomić i przetestować swój scenariusz.

Uruchom swój scenariusz

12. Kliknij na dymek

Kliknij ten dymek, aby zobaczyć wynik swojego żądania.

Kliknij na dymek

Skup się na części wyjściowej, zobaczysz "Dane".

Możesz zobaczyć "plik", który jest adresem URL wygenerowanego pliku MP3 z naszego tekstu.

wygenerowany plik Mp3

Jeśli przejdziesz do tego URL, możesz odtworzyć i pobrać plik MP3.

Aby dane ze SpeechGen były łatwo dostępne dla innych modułów, możemy dodać kolejny moduł do naszego scenariusza.

14. Dodaj kolejny moduł

Najedź myszką obok pierwszego modułu, który mamy, zobaczysz przycisk plusa, kliknij na niego.

następny moduł

15. Wybierz opcję 'JSON'

Wyszukaj "JSON" i wybierz tę opcję.

Wybierz json

16. Wybierz opcję "Parsuj JSON"

Następnie wybierz "Parsuj JSON", abyśmy mogli wyeksportować dane ze SpeechGen do wielu zmiennych, których możemy użyć w naszym scenariuszu.

Wybierz Parsuj JSON

17. Wprowadź 'Dane'

Kliknij tutaj (ciąg JSON), aby wprowadzić "Dane" z poprzedniego modułu HTTP.

Wprowadź Dane

18. Kliknij 'Dane'

Kliknij "Dane", aby dodać je do pola i kliknij OK, aby zapisać zmiany.

Kliknij Dane

19. Uruchom raz

Kliknij "Uruchom raz", aby wykonać scenariusz.

Kliknij Uruchom raz, aby wykonać scenariusz

Wybierz "Uruchom mimo wszystko", aby wymusić na Make uruchomienie scenariusza.

Uruchom mimo wszystko

Dzieje się tak, ponieważ JSON nie powinien być ostatnim modułem w scenariuszu, ponieważ przekształca dane z innego modułu, a my nic z tymi danymi nie robimy. W tym przypadku chcemy najpierw zobaczyć dane, a potem zdecydować, co z nimi zrobić.

20. Kliknij dymek

Kliknij dymek nad modułem JSON, aby zobaczyć otrzymane dane.

Kliknij dymek nad modułem JSON

Teraz dane, które były pod "Dane", są teraz w poszczególnych zmiennych, których możemy użyć w kolejnych modułach...

Możesz również zauważyć zmienną "plik", która zawierała adres URL wygenerowanego pliku MP3, którego użyjemy w następnym module.

Zauważ plik

Teraz prześlijmy wygenerowany plik MP3 do Dropboxa. Aby to zrobić, musimy najpierw pobrać plik MP3 w tym scenariuszu.

21. Dodaj kolejny moduł HTTP, aby pobrać plik

Dodaj kolejny moduł HTTP

Wybierz Pobierz plik, abyśmy mogli pobrać plik MP3 w scenariuszu.

Wybierz Pobierz plik

Większość modułów wymaga jedynie adresu URL, ale Dropbox wymaga bezpośredniego wprowadzenia rzeczywistych danych pliku.

22. Zmapuj zmienną 'plik'

Zmapuj zmienną "plik", która jest adresem URL, którego możemy użyć do pobrania pliku.

Zmapuj zmienną plik

23. Moduł DropBox

Następnie dodamy moduł DropBox.

Moduł DropBox

24. Wybierz opcję "Prześlij plik"

Wybierz opcję Prześlij plik

Wybierz folder do zapisania w swoim Dropboxie, a następnie wybierz Mapuj, abyśmy mogli zmienić nazwę przesłanego pliku MP3.

Plik

Upewnij się, że na końcu nazwy dodasz rozszerzenie pliku ".mp3", aby Dropbox łatwiej rozpoznał go jako plik MP3, który można odtworzyć.

Plik Mp3

Po uruchomieniu scenariusza, plik został przesłany do DropBoxa.

Plik przesłany do DropBoxa

Kompletny proces dla pierwszej metody

Podgląd całego procesu

HTTP: Generowanie dźwięku z tekstu za pomocą SpeechGen.io
JSON: Parsowanie danych otrzymanych z API SpeechGen
HTTP: Pobieranie danych binarnych wygenerowanego pliku
Dropbox: Przesyłanie tych danych do Dropboxa

2. Metoda dla długich tekstów

Teraz wykorzystujemy API SpeechGen do długich tekstów, aby wygenerować długi TTS.

Druga metoda jest przeznaczona dla tekstów dłuższych niż 2000 znaków. W przeciwieństwie do pierwszej metody, która szybko konwertuje krótkie teksty na mowę, to podejście obejmuje dwa kroki ze względu na czas przetwarzania wymagany dla dłuższych tekstów.

Początkowe żądanie: Wysyłasz tekst z wybranymi ustawieniami głosu, aby rozpocząć proces konwersji.
Kolejne żądanie: Po odczekaniu co najmniej jednej minuty, wykonujesz kolejne żądanie, aby pobrać gotowy plik audio. To opóźnienie zapewnia systemowi wystarczająco dużo czasu na przetworzenie dłuższego tekstu bez żadnych problemów.

Główna różnica w stosunku do pierwszej metody to potrzeba drugiego żądania ze względu na dłuższy czas przetwarzania. Ta metoda zapewnia efektywne zarządzanie obszernymi tekstami, dzięki czemu nadaje się do tworzenia dłuższych treści audio.

Następnie prześlemy plik do Dropboxa jako demonstrację, ale możliwości wykorzystania tego API TTS są nieograniczone.

Możesz pobrać i zaimportować demonstracyjny schemat dla długich tekstów w formacie JSON, pokazany w tym blogu i go użyć.