27-10-2025 , 27-10-2025

Uprość tworzenie treści głosowych: Integracja SpeechGen.io z Make.com. Ten wpis na blogu przeprowadzi Cię przez proces integracji usługi automatyzacji Make.com (dawniej Integromat) z naszą usługą syntezy mowy opartą na sieciach neuronowych, SpeechGen.io. Ta integracja umożliwia automatyzację procesów zamiany tekstu na mowę, co ułatwia i usprawnia tworzenie treści.
Opisujemy dwie metody, w zależności od długości tekstu, który chcesz zamienić na mowę:
Dla tekstów do 2000 znaków: Ta metoda polega na szybkim żądaniu i natychmiastowym otrzymaniu wyjścia mowy. Jest idealna do krótkich tekstów, które muszą być szybko przekonwertowane.
Dla tekstów powyżej 2000 znaków: Ta metoda wykorzystuje dwa żądania. Pierwsze żądanie wysyła tekst z ustawieniami głosu do konwersji. Drugie żądanie, które powinno być wykonane nie wcześniej niż minutę później, pobiera gotowy plik audio. Takie podejście zapewnia efektywne przetwarzanie dłuższych tekstów bez przeciążania systemu.
Make.com ułatwia automatyzację tych procesów bez potrzeby posiadania głębokiej wiedzy technicznej. Możesz ustawić wyzwalacze, aby automatycznie uruchamiać proces zamiany tekstu na mowę, gdy spełnione zostaną określone warunki, takie jak dodanie nowego tekstu do Twojego CMS lub bazy danych.
Aby rozpocząć integrację, musisz zapoznać się z naszym API. Wszystkie niezbędne informacje, w tym dokumentację i często zadawane pytania, znajdziesz na stronie SpeechGen.io API FAQ.
W tym wpisie na blogu nauczymy się, jak wygenerować plik MP3 z tekstu za pomocą SpeechGen, a następnie przesłać ten plik MP3 do DropBoxa.
Możesz pobrać i zaimportować plik JSON z demonstracyjnym projektem, pokazanym w tym blogu i go użyć.

Zaloguj się do Make.com i kliknij "Utwórz nowy scenariusz".


Wyszukaj "HTTP" i wybierz "HTTP" z listy dostępnych modułów.


Wprowadź adres URL jako https://speechgen.io/index.php?r=api/text
Następnie kliknij "Dodaj parametr", aby dodać parametry zapytania do naszego żądania.

Musimy wprowadzić łącznie 4 parametry, więc dodajmy jeszcze 3.



Teraz czas uruchomić i przetestować swój scenariusz.

Kliknij ten dymek, aby zobaczyć wynik swojego żądania.

Skup się na części wyjściowej, zobaczysz "Dane".
Możesz zobaczyć "plik", który jest adresem URL wygenerowanego pliku MP3 z naszego tekstu.

Jeśli przejdziesz do tego URL, możesz odtworzyć i pobrać plik MP3.
Aby dane ze SpeechGen były łatwo dostępne dla innych modułów, możemy dodać kolejny moduł do naszego scenariusza.
Najedź myszką obok pierwszego modułu, który mamy, zobaczysz przycisk plusa, kliknij na niego.

Wyszukaj "JSON" i wybierz tę opcję.

Następnie wybierz "Parsuj JSON", abyśmy mogli wyeksportować dane ze SpeechGen do wielu zmiennych, których możemy użyć w naszym scenariuszu.

Kliknij tutaj (ciąg JSON), aby wprowadzić "Dane" z poprzedniego modułu HTTP.

Kliknij "Dane", aby dodać je do pola i kliknij OK, aby zapisać zmiany.

Kliknij "Uruchom raz", aby wykonać scenariusz.

Wybierz "Uruchom mimo wszystko", aby wymusić na Make uruchomienie scenariusza.

Dzieje się tak, ponieważ JSON nie powinien być ostatnim modułem w scenariuszu, ponieważ przekształca dane z innego modułu, a my nic z tymi danymi nie robimy. W tym przypadku chcemy najpierw zobaczyć dane, a potem zdecydować, co z nimi zrobić.
Kliknij dymek nad modułem JSON, aby zobaczyć otrzymane dane.

Teraz dane, które były pod "Dane", są teraz w poszczególnych zmiennych, których możemy użyć w kolejnych modułach...
Możesz również zauważyć zmienną "plik", która zawierała adres URL wygenerowanego pliku MP3, którego użyjemy w następnym module.

Teraz prześlijmy wygenerowany plik MP3 do Dropboxa. Aby to zrobić, musimy najpierw pobrać plik MP3 w tym scenariuszu.

Wybierz Pobierz plik, abyśmy mogli pobrać plik MP3 w scenariuszu.

Większość modułów wymaga jedynie adresu URL, ale Dropbox wymaga bezpośredniego wprowadzenia rzeczywistych danych pliku.
Zmapuj zmienną "plik", która jest adresem URL, którego możemy użyć do pobrania pliku.

Następnie dodamy moduł DropBox.


Wybierz folder do zapisania w swoim Dropboxie, a następnie wybierz Mapuj, abyśmy mogli zmienić nazwę przesłanego pliku MP3.

Upewnij się, że na końcu nazwy dodasz rozszerzenie pliku ".mp3", aby Dropbox łatwiej rozpoznał go jako plik MP3, który można odtworzyć.

Po uruchomieniu scenariusza, plik został przesłany do DropBoxa.


Teraz wykorzystujemy API SpeechGen do długich tekstów, aby wygenerować długi TTS.
Druga metoda jest przeznaczona dla tekstów dłuższych niż 2000 znaków. W przeciwieństwie do pierwszej metody, która szybko konwertuje krótkie teksty na mowę, to podejście obejmuje dwa kroki ze względu na czas przetwarzania wymagany dla dłuższych tekstów.
Główna różnica w stosunku do pierwszej metody to potrzeba drugiego żądania ze względu na dłuższy czas przetwarzania. Ta metoda zapewnia efektywne zarządzanie obszernymi tekstami, dzięki czemu nadaje się do tworzenia dłuższych treści audio.
Następnie prześlemy plik do Dropboxa jako demonstrację, ale możliwości wykorzystania tego API TTS są nieograniczone.
Możesz pobrać i zaimportować demonstracyjny schemat dla długich tekstów w formacie JSON, pokazany w tym blogu i go użyć.

Zaloguj się do Make.com i kliknij "Utwórz nowy scenariusz".


Wyszukaj "HTTP" i wybierz "HTTP" z listy dostępnych modułów.


Wprowadź adres URL jako https://speechgen.io/index.php?r=api/longtext
Następnie kliknij „Dodaj parametr”, aby dodać parametry zapytania do naszego żądania.

Musimy wprowadzić łącznie 4 parametry, więc dodajmy jeszcze 3.


Teraz czas uruchomić i przetestować Twój scenariusz.

Kliknij ten dymek, aby zobaczyć wynik swojego żądania.

Skup się na części wyjściowej. Zobaczysz „Dane”.
Możesz zobaczyć „id”, które jest identyfikatorem naszego żądania.

Teraz, aby dane ze SpeechGen były łatwo dostępne dla innych modułów, możemy dodać kolejny moduł do naszego scenariusza.
Najedź myszką obok pierwszego modułu, który mamy, zobaczysz przycisk plusa, kliknij go.

Wyszukaj „JSON” i wybierz tę opcję.

Następnie wybierz „Parsuj JSON”, abyśmy mogli wyeksportować dane ze SpeechGen do wielu zmiennych, których możemy użyć w naszym scenariuszu.

Kliknij tutaj, aby wprowadzić „Dane” z poprzedniego modułu HTTP.

Kliknij „Dane”, aby dodać je do pola i kliknij OK, aby zapisać zmiany.

Kliknij „Uruchom raz”, aby wykonać scenariusz.

Wybierz „Uruchom mimo wszystko”, aby wymusić na Make uruchomienie scenariusza.

Dzieje się tak, ponieważ JSON nie powinien być ostatnim modułem w scenariuszu, ponieważ przekształca dane z innego modułu, a my nic z tymi danymi nie robimy. W tym przypadku chcemy najpierw zobaczyć dane, a następnie zdecydować, co z nimi zrobić.
Kliknij dymek nad modułem JSON, aby zobaczyć otrzymane dane.

Teraz wszystkie dane, które znajdowały się pod „Danymi”, są teraz w indywidualnych zmiennych, których możemy użyć w kolejnych modułach.
Możesz również zauważyć zmienną „ID”, której użyjemy w kolejnych krokach, aby uzyskać adres URL naszego pliku TTS.

Dodaj moduł SLEEP, aby poczekać na wygenerowanie TTS.


Ustaw czas trwania SLEEP na 1-5 minut (60-300 sekund).
Dla naszej demonstracji ustawmy go na 200 sekund.

Teraz prześlijmy wygenerowany plik MP3 do Dropboxa. Aby to zrobić, musimy najpierw pobrać plik MP3 w tym scenariuszu.
Dodaj kolejny moduł HTTP, aby pobrać wygenerowany TTS.

Wstaw niezbędne parametry:

Uruchom scenariusz, aby pobrać dane i dodaj kolejny moduł Parsuj JSON.

Zmapuj „Dane” z poprzedniego modułu HTTP.
Uruchom scenariusz jeszcze raz, aby pobrać dane z ostatniego modułu Parsuj JSON, a następnie dodaj kolejny moduł HTTP, aby pobrać plik.

Wybierz „Pobierz plik”, abyśmy mogli pobrać plik MP3 w scenariuszu.

Większość modułów wymaga jedynie adresu URL, ale Dropbox wymaga bezpośredniego wprowadzenia rzeczywistych danych pliku.
Zmapuj zmienną „plik”, która jest adresem URL, którego możemy użyć do pobrania pliku.



Wybierz folder do zapisania w Dropboxie, a następnie wybierz „Mapuj”, abyśmy mogli zmienić nazwę przesłanego pliku MP3.

Upewnij się, że na końcu nazwy dodasz rozszerzenie „.mp3”, aby Dropbox łatwiej rozpoznał go jako plik MP3, który można odtworzyć.

Po uruchomieniu scenariusza, plik został przesłany do Dropboxa.

Integracja SpeechGen.io z Make.com otwiera szerokie możliwości automatyzacji tworzenia treści głosowych. Automatyzacja syntezy mowy może być przydatna do:
Niezależnie od tego, czy masz do czynienia z krótkimi powiadomieniami, czy długimi materiałami edukacyjnymi, nasz przewodnik pomoże Ci skonfigurować wydajny proces przy minimalnym wysiłku. Przekształć swój tekst w żywą mowę automatycznie, czyniąc swoje treści bardziej dostępnymi i angażującymi dla szerokiej publiczności.