Tích hợp API SpeechGen với Make.com: Tự động hóa quy trình chuyển văn bản thành giọng nói

27-10-2025 , 27-10-2025

Đơn giản hóa việc tạo nội dung giọng nói: Tích hợp SpeechGen.io với Make.com. Bài đăng trên blog này hướng dẫn bạn cách tích hợp dịch vụ tự động hóa Make.com (trước đây là Integromat) với dịch vụ tổng hợp giọng nói dựa trên mạng thần kinh của chúng tôi, SpeechGen.io. Việc tích hợp này cho phép tự động hóa các quy trình chuyển văn bản thành giọng nói, giúp việc tạo nội dung dễ dàng và hiệu quả hơn.

Cách hoạt động

Chúng tôi đề cập đến hai phương pháp dựa trên độ dài của văn bản bạn muốn chuyển đổi thành giọng nói:

Đối với văn bản tối đa 2000 ký tự: Phương pháp này bao gồm một yêu cầu nhanh chóng và nhận ngay đầu ra giọng nói. Nó hoàn hảo cho các văn bản ngắn cần được chuyển đổi nhanh chóng.
Đối với văn bản trên 2000 ký tự: Phương pháp này sử dụng hai yêu cầu. Yêu cầu đầu tiên gửi văn bản với các cài đặt giọng nói để chuyển đổi. Yêu cầu thứ hai, nên được thực hiện không sớm hơn một phút sau, sẽ truy xuất tệp âm thanh đã hoàn thành. Cách tiếp cận này đảm bảo rằng các văn bản dài hơn được xử lý hiệu quả mà không làm quá tải hệ thống.

Tại sao nên sử dụng Make.com?

Make.com tạo điều kiện thuận lợi cho việc tự động hóa các quy trình này mà không cần kiến thức kỹ thuật sâu. Bạn có thể thiết lập các trình kích hoạt để tự động bắt đầu quá trình chuyển văn bản thành giọng nói khi đáp ứng các điều kiện nhất định, chẳng hạn như thêm văn bản mới vào CMS hoặc cơ sở dữ liệu của bạn.

Bắt đầu

Để bắt đầu tích hợp, bạn sẽ cần làm quen với API của chúng tôi. Bạn có thể tìm thấy tất cả thông tin cần thiết, bao gồm tài liệu và Câu hỏi thường gặp, tại Câu hỏi thường gặp về API SpeechGen.io.

Hướng dẫn video đầy đủ

1. Phương pháp văn bản ngắn

Trong bài đăng trên blog này, chúng ta sẽ tìm hiểu cách tạo tệp Mp3 từ văn bản bằng SpeechGen, sau đó tải tệp Mp3 đó lên DropBox.

Bạn có thể tải xuống và nhập tệp json dự án demo được hiển thị trong blog này và sử dụng nó.

1. Yêu cầu

2. Lấy khóa API SpeechGen của bạn

Đăng nhập vào hồ sơ SpeechGen.io của bạn
Điều hướng đến hồ sơ của bạn
Hiển thị và sao chép Khóa API của bạn. Chúng ta sẽ sử dụng nó sau.

Khóa API Speechgen

3. Tạo một kịch bản mới

Đăng nhập vào Make.com & Nhấp vào "Tạo một kịch bản mới".

Tạo một kịch bản mới

4. Thêm một mô-đun mới

Thêm một mô-đun mới

5. Chọn HTTP

Tìm kiếm "HTTP" và chọn "HTTP" từ danh sách các mô-đun có sẵn.

Chọn HTTP từ danh sách

6. Chọn Thực hiện yêu cầu

Chọn Thực hiện yêu cầu

7. Nhập URL

Nhập URL là https://speechgen.io/index.php?r=api/text

Sau đó nhấp vào "Thêm tham số" để thêm các tham số truy vấn vào yêu cầu của chúng ta

Nhập URL

8. Chèn thêm 3 tham số

Chúng ta cần nhập tổng cộng 4 tham số, vì vậy hãy thêm 3 tham số nữa.

Thêm 3 tham số nữa

9. Nhập các tham số bắt buộc

Nhập các tham số bắt buộc

token = Mã API bạn đã sao chép từ Bước 2
email = Email liên kết với tài khoản SpeechGen của bạn
voice = Tên chính xác của giọng nói, bạn có thể chọn giọng nói bạn thích từ Danh sách giọng nói đầy đủ và sao chép tên giọng nói từ đó. Giọng nói API JSON https://speechgen.io/index.php?r=api/voices.
text = Văn bản bạn muốn chuyển thành giọng nói. Ví dụ, tôi sẽ dán văn bản sau: "Một giải pháp thiết thực để tạo thuyết minh, tài liệu học tập điện tử và quảng cáo. Tạo giọng nói từ văn bản bằng nhiều ngôn ngữ và giọng điệu. Tùy chỉnh cài đặt giọng nói để đáp ứng các nhu cầu cụ thể".

10. Nhấp vào OK để lưu các thay đổi

OK để lưu các thay đổi

11. Chạy kịch bản của bạn

Bây giờ là lúc chạy và kiểm tra kịch bản của bạn.

Chạy kịch bản của bạn

12. Nhấp vào bong bóng

Nhấp vào bong bóng này để xem kết quả yêu cầu của bạn.

Nhấp vào bong bóng

Tập trung vào phần đầu ra, bạn sẽ thấy 'Dữ liệu'.

Bạn có thể thấy 'tệp' là URL của tệp Mp3 đã tạo từ văn bản của chúng ta

tệp Mp3 đã tạo

Nếu bạn điều hướng đến URL này, bạn có thể phát và tải xuống tệp Mp3.

Để làm cho dữ liệu từ SpeechGen dễ dàng truy cập bởi các mô-đun khác, chúng ta có thể thêm một Mô-đun khác vào Kịch bản của mình.

14. Thêm một mô-đun khác

Di chuột bên cạnh mô-đun đầu tiên chúng ta có, bạn sẽ thấy một nút dấu cộng, nhấp vào nó

mô-đun tiếp theo

15. Chọn tùy chọn 'JSON'

Tìm kiếm 'JSON' và chọn tùy chọn này.

Chọn json

16. Chọn Phân tích JSON

Sau đó chọn "Phân tích JSON" để chúng ta có thể xuất dữ liệu từ SpeechGen thành nhiều biến mà chúng ta có thể sử dụng trong kịch bản của mình.

Chọn Phân tích JSON

17. Nhập 'Dữ liệu'

Nhấp vào đây (chuỗi JSON) để nhập 'Dữ liệu' từ mô-đun HTTP trước đó

Nhập Dữ liệu

18. Nhấp vào 'Dữ liệu'

Nhấp vào 'Dữ liệu' để thêm nó vào trường và nhấp OK để lưu các thay đổi.

Nhấp vào Dữ liệu

19. Chạy một lần

Nhấp vào 'Chạy một lần' để thực thi Kịch bản.

Nhấp vào Chạy một lần để thực thi Kịch bản

Chọn 'Chạy dù sao' để buộc Make chạy Kịch bản.

Chạy dù sao

Điều này là do JSON không nên là mô-đun cuối cùng trong kịch bản, vì nó chuyển đổi dữ liệu từ một mô-đun khác và chúng ta không làm gì với dữ liệu đó, trong trường hợp này chúng ta chỉ muốn xem dữ liệu trước, sau đó quyết định làm gì với nó.

20. Nhấp vào bong bóng

Nhấp vào bong bóng phía trên mô-đun JSON để xem dữ liệu chúng ta nhận được.

Nhấp vào bong bóng phía trên mô-đun JSON

Bây giờ dữ liệu đã nằm dưới 'Dữ liệu' hiện nằm trong các biến riêng lẻ mà chúng ta có thể sử dụng trong các mô-đun tiếp theo...

Bạn cũng có thể nhận thấy biến 'tệp' có URL của Tệp Mp3 đã tạo mà chúng ta sẽ sử dụng trong mô-đun tiếp theo.

Lưu ý tệp

Bây giờ hãy tải tệp Mp3 đã tạo lên Dropbox, để làm điều đó chúng ta cần tải tệp Mp3 trong kịch bản này trước.

21. Thêm một Mô-đun HTTP khác để tải xuống tệp

Thêm một Mô-đun HTTP khác

Chọn Lấy tệp để chúng ta có thể tải xuống Tệp Mp3 trong Kịch bản.

Chọn Lấy tệp

Hầu hết các mô-đun chỉ yêu cầu URL, nhưng DropBox yêu cầu nhập trực tiếp dữ liệu tệp thực tế.

22. Ánh xạ biến 'tệp'

Ánh xạ biến 'tệp', là URL chúng ta có thể sử dụng để lấy tệp.

Ánh xạ biến tệp

23. Mô-đun DropBox

Sau đó chúng ta sẽ thêm mô-đun DropBox.

Mô-đun DropBox

24. Chọn Tải lên tệp

Chọn Tải lên tệp

Chọn thư mục để lưu vào trong Dropbox của bạn, sau đó chọn Ánh xạ để chúng ta có thể thay đổi tên của Tệp Mp3 đã tải lên.

Tệp

Đảm bảo bạn thêm phần mở rộng tệp '.mp3' vào cuối tên, để Dropbox dễ dàng nhận ra nó là một tệp Mp3 mà bạn có thể phát.

Tệp Mp3

Sau khi chạy Kịch bản, chúng ta có Tệp đã được tải lên DropBox

Tệp đã được tải lên DropBox

Quy trình hoàn chỉnh cho phương pháp thứ nhất

Bản xem trước toàn bộ quy trình

HTTP: Tạo Âm thanh từ văn bản bằng SpeechGen.io
JSON: Phân tích dữ liệu chúng ta nhận được từ API SpeechGen
HTTP: Lấy dữ liệu nhị phân của tệp đã tạo
Dropbox: Tải dữ liệu đó lên Dropbox

2. Phương pháp văn bản dài

Bây giờ, chúng ta đang sử dụng API văn bản dài của SpeechGen để tạo TTS dài.

Phương pháp thứ hai được thiết kế cho các văn bản dài hơn 2000 ký tự. Không giống như phương pháp đầu tiên, nhanh chóng chuyển đổi các văn bản ngắn thành giọng nói, cách tiếp cận này bao gồm hai bước do thời gian xử lý cần thiết cho các văn bản dài hơn.

Yêu cầu ban đầu: Bạn gửi văn bản với các cài đặt giọng nói đã chọn để bắt đầu quá trình chuyển đổi.
Yêu cầu tiếp theo: Sau khi chờ ít nhất một phút, bạn thực hiện một yêu cầu khác để truy xuất tệp âm thanh đã hoàn thành. Độ trễ này đảm bảo hệ thống có đủ thời gian để xử lý văn bản dài hơn mà không gặp bất kỳ sự cố nào.

Sự khác biệt chính so với phương pháp đầu tiên là cần có yêu cầu thứ hai do thời gian xử lý lâu hơn. Phương pháp này đảm bảo xử lý hiệu quả các văn bản mở rộng, làm cho nó phù hợp để tạo nội dung âm thanh dài hơn.

Sau đó chúng ta sẽ tải tệp lên Dropbox làm demo, nhưng các tùy chọn là vô tận về cách bạn có thể sử dụng API TTS này.

Bạn có thể tải xuống và nhập bản thiết kế demo cho tệp json văn bản dài được hiển thị trong blog này và sử dụng nó.