Tích hợp API SpeechGen với Make.com: Tự động hóa quy trình chuyển văn bản thành giọng nói

, 27-10-2025

Đơn giản hóa việc tạo nội dung giọng nói: Tích hợp SpeechGen.io với Make.com. Bài đăng trên blog này hướng dẫn bạn cách tích hợp dịch vụ tự động hóa Make.com (trước đây là Integromat) với dịch vụ tổng hợp giọng nói dựa trên mạng thần kinh của chúng tôi, SpeechGen.io. Việc tích hợp này cho phép tự động hóa các quy trình chuyển văn bản thành giọng nói, giúp việc tạo nội dung dễ dàng và hiệu quả hơn.

Cách hoạt động

Chúng tôi đề cập đến hai phương pháp dựa trên độ dài của văn bản bạn muốn chuyển đổi thành giọng nói:

  1. Đối với văn bản tối đa 2000 ký tự: Phương pháp này bao gồm một yêu cầu nhanh chóng và nhận ngay đầu ra giọng nói. Nó hoàn hảo cho các văn bản ngắn cần được chuyển đổi nhanh chóng.

  2. Đối với văn bản trên 2000 ký tự: Phương pháp này sử dụng hai yêu cầu. Yêu cầu đầu tiên gửi văn bản với các cài đặt giọng nói để chuyển đổi. Yêu cầu thứ hai, nên được thực hiện không sớm hơn một phút sau, sẽ truy xuất tệp âm thanh đã hoàn thành. Cách tiếp cận này đảm bảo rằng các văn bản dài hơn được xử lý hiệu quả mà không làm quá tải hệ thống.

Tại sao nên sử dụng Make.com?

Make.com tạo điều kiện thuận lợi cho việc tự động hóa các quy trình này mà không cần kiến thức kỹ thuật sâu. Bạn có thể thiết lập các trình kích hoạt để tự động bắt đầu quá trình chuyển văn bản thành giọng nói khi đáp ứng các điều kiện nhất định, chẳng hạn như thêm văn bản mới vào CMS hoặc cơ sở dữ liệu của bạn.

Bắt đầu

Để bắt đầu tích hợp, bạn sẽ cần làm quen với API của chúng tôi. Bạn có thể tìm thấy tất cả thông tin cần thiết, bao gồm tài liệu và Câu hỏi thường gặp, tại Câu hỏi thường gặp về API SpeechGen.io.

Hướng dẫn video đầy đủ

1. Phương pháp văn bản ngắn

Trong bài đăng trên blog này, chúng ta sẽ tìm hiểu cách tạo tệp Mp3 từ văn bản bằng SpeechGen, sau đó tải tệp Mp3 đó lên DropBox.

Bạn có thể tải xuống và nhập tệp json dự án demo được hiển thị trong blog này và sử dụng nó.

1. Yêu cầu

2. Lấy khóa API SpeechGen của bạn

  1. Đăng nhập vào hồ sơ SpeechGen.io của bạn
  2. Điều hướng đến hồ sơ của bạn
  3. Hiển thị và sao chép Khóa API của bạn. Chúng ta sẽ sử dụng nó sau.

Khóa API Speechgen

3. Tạo một kịch bản mới

Đăng nhập vào Make.com & Nhấp vào "Tạo một kịch bản mới".

Tạo một kịch bản mới

4. Thêm một mô-đun mới

Thêm một mô-đun mới

5. Chọn HTTP

Tìm kiếm "HTTP" và chọn "HTTP" từ danh sách các mô-đun có sẵn.

Chọn HTTP từ danh sách

6. Chọn Thực hiện yêu cầu

Chọn Thực hiện yêu cầu

7. Nhập URL

Nhập URL là https://speechgen.io/index.php?r=api/text

Sau đó nhấp vào "Thêm tham số" để thêm các tham số truy vấn vào yêu cầu của chúng ta

Nhập URL

8. Chèn thêm 3 tham số

Chúng ta cần nhập tổng cộng 4 tham số, vì vậy hãy thêm 3 tham số nữa.

Thêm 3 tham số nữa

9. Nhập các tham số bắt buộc

Nhập các tham số bắt buộc

  • token = Mã API bạn đã sao chép từ Bước 2
  • email = Email liên kết với tài khoản SpeechGen của bạn
  • voice = Tên chính xác của giọng nói, bạn có thể chọn giọng nói bạn thích từ Danh sách giọng nói đầy đủ và sao chép tên giọng nói từ đó. Giọng nói API JSON https://speechgen.io/index.php?r=api/voices.
  • text = Văn bản bạn muốn chuyển thành giọng nói. Ví dụ, tôi sẽ dán văn bản sau: "Một giải pháp thiết thực để tạo thuyết minh, tài liệu học tập điện tử và quảng cáo. Tạo giọng nói từ văn bản bằng nhiều ngôn ngữ và giọng điệu. Tùy chỉnh cài đặt giọng nói để đáp ứng các nhu cầu cụ thể".

10. Nhấp vào OK để lưu các thay đổi

OK để lưu các thay đổi

11. Chạy kịch bản của bạn

Bây giờ là lúc chạy và kiểm tra kịch bản của bạn.

Chạy kịch bản của bạn

12. Nhấp vào bong bóng

Nhấp vào bong bóng này để xem kết quả yêu cầu của bạn.

Nhấp vào bong bóng

Tập trung vào phần đầu ra, bạn sẽ thấy 'Dữ liệu'.

Bạn có thể thấy 'tệp' là URL của tệp Mp3 đã tạo từ văn bản của chúng ta

tệp Mp3 đã tạo

Nếu bạn điều hướng đến URL này, bạn có thể phát và tải xuống tệp Mp3.

Để làm cho dữ liệu từ SpeechGen dễ dàng truy cập bởi các mô-đun khác, chúng ta có thể thêm một Mô-đun khác vào Kịch bản của mình.

14. Thêm một mô-đun khác

Di chuột bên cạnh mô-đun đầu tiên chúng ta có, bạn sẽ thấy một nút dấu cộng, nhấp vào nó

mô-đun tiếp theo

15. Chọn tùy chọn 'JSON'

Tìm kiếm 'JSON' và chọn tùy chọn này.

Chọn json

16. Chọn Phân tích JSON

Sau đó chọn "Phân tích JSON" để chúng ta có thể xuất dữ liệu từ SpeechGen thành nhiều biến mà chúng ta có thể sử dụng trong kịch bản của mình.

Chọn Phân tích JSON

17. Nhập 'Dữ liệu'

Nhấp vào đây (chuỗi JSON) để nhập 'Dữ liệu' từ mô-đun HTTP trước đó

Nhập Dữ liệu

18. Nhấp vào 'Dữ liệu'

Nhấp vào 'Dữ liệu' để thêm nó vào trường và nhấp OK để lưu các thay đổi.

Nhấp vào Dữ liệu

19. Chạy một lần

Nhấp vào 'Chạy một lần' để thực thi Kịch bản.

Nhấp vào Chạy một lần để thực thi Kịch bản

Chọn 'Chạy dù sao' để buộc Make chạy Kịch bản.

Chạy dù sao

Điều này là do JSON không nên là mô-đun cuối cùng trong kịch bản, vì nó chuyển đổi dữ liệu từ một mô-đun khác và chúng ta không làm gì với dữ liệu đó, trong trường hợp này chúng ta chỉ muốn xem dữ liệu trước, sau đó quyết định làm gì với nó.

20. Nhấp vào bong bóng

Nhấp vào bong bóng phía trên mô-đun JSON để xem dữ liệu chúng ta nhận được.

Nhấp vào bong bóng phía trên mô-đun JSON

Bây giờ dữ liệu đã nằm dưới 'Dữ liệu' hiện nằm trong các biến riêng lẻ mà chúng ta có thể sử dụng trong các mô-đun tiếp theo...

Bạn cũng có thể nhận thấy biến 'tệp' có URL của Tệp Mp3 đã tạo mà chúng ta sẽ sử dụng trong mô-đun tiếp theo.

Lưu ý tệp

Bây giờ hãy tải tệp Mp3 đã tạo lên Dropbox, để làm điều đó chúng ta cần tải tệp Mp3 trong kịch bản này trước.

21. Thêm một Mô-đun HTTP khác để tải xuống tệp

Thêm một Mô-đun HTTP khác

Chọn Lấy tệp để chúng ta có thể tải xuống Tệp Mp3 trong Kịch bản.

Chọn Lấy tệp

Hầu hết các mô-đun chỉ yêu cầu URL, nhưng DropBox yêu cầu nhập trực tiếp dữ liệu tệp thực tế.

22. Ánh xạ biến 'tệp'

Ánh xạ biến 'tệp', là URL chúng ta có thể sử dụng để lấy tệp.

Ánh xạ biến tệp

23. Mô-đun DropBox

Sau đó chúng ta sẽ thêm mô-đun DropBox.

Mô-đun DropBox

24. Chọn Tải lên tệp

Chọn Tải lên tệp

Chọn thư mục để lưu vào trong Dropbox của bạn, sau đó chọn Ánh xạ để chúng ta có thể thay đổi tên của Tệp Mp3 đã tải lên.

Tệp

Đảm bảo bạn thêm phần mở rộng tệp '.mp3' vào cuối tên, để Dropbox dễ dàng nhận ra nó là một tệp Mp3 mà bạn có thể phát.

Tệp Mp3

Sau khi chạy Kịch bản, chúng ta có Tệp đã được tải lên DropBox

Tệp đã được tải lên DropBox

Quy trình hoàn chỉnh cho phương pháp thứ nhất

Bản xem trước toàn bộ quy trình

  1. HTTP: Tạo Âm thanh từ văn bản bằng SpeechGen.io
  2. JSON: Phân tích dữ liệu chúng ta nhận được từ API SpeechGen
  3. HTTP: Lấy dữ liệu nhị phân của tệp đã tạo
  4. Dropbox: Tải dữ liệu đó lên Dropbox

2. Phương pháp văn bản dài

Bây giờ, chúng ta đang sử dụng API văn bản dài của SpeechGen để tạo TTS dài.

Phương pháp thứ hai được thiết kế cho các văn bản dài hơn 2000 ký tự. Không giống như phương pháp đầu tiên, nhanh chóng chuyển đổi các văn bản ngắn thành giọng nói, cách tiếp cận này bao gồm hai bước do thời gian xử lý cần thiết cho các văn bản dài hơn.

  1. Yêu cầu ban đầu: Bạn gửi văn bản với các cài đặt giọng nói đã chọn để bắt đầu quá trình chuyển đổi.
  2. Yêu cầu tiếp theo: Sau khi chờ ít nhất một phút, bạn thực hiện một yêu cầu khác để truy xuất tệp âm thanh đã hoàn thành. Độ trễ này đảm bảo hệ thống có đủ thời gian để xử lý văn bản dài hơn mà không gặp bất kỳ sự cố nào.

Sự khác biệt chính so với phương pháp đầu tiên là cần có yêu cầu thứ hai do thời gian xử lý lâu hơn. Phương pháp này đảm bảo xử lý hiệu quả các văn bản mở rộng, làm cho nó phù hợp để tạo nội dung âm thanh dài hơn.

Sau đó chúng ta sẽ tải tệp lên Dropbox làm demo, nhưng các tùy chọn là vô tận về cách bạn có thể sử dụng API TTS này.

Bạn có thể tải xuống và nhập bản thiết kế demo cho tệp json văn bản dài được hiển thị trong blog này và sử dụng nó.

1. Yêu cầu

2. Lấy khóa API SpeechGen của bạn

  1. Đăng nhập vào hồ sơ SpeechGen.io của bạn
  2. Điều hướng đến hồ sơ của bạn
  3. Hiển thị và sao chép Khóa API của bạn. Chúng ta sẽ sử dụng nó sau.

Khóa API Speechgen

3. Tạo một kịch bản mới

Đăng nhập vào Make.com & Nhấp vào "Tạo một kịch bản mới".

Tạo một kịch bản mới

4. Thêm một mô-đun mới

Thêm một mô-đun mới

5. Chọn HTTP

Tìm kiếm "HTTP" và chọn "HTTP" từ danh sách các mô-đun có sẵn.

Select HTTP from the list

6. Chọn "Make a request"

Select Make a request

7. Nhập URL

Nhập URL là https://speechgen.io/index.php?r=api/longtext

Sau đó nhấp vào “Add parameter” để thêm các tham số truy vấn vào yêu cầu của chúng ta.

Input URL

8. Nhập 4 tham số

Chúng ta cần nhập tổng cộng 4 tham số, vì vậy hãy thêm 3 tham số nữa.

Add parameter 3 more

9. Nhập các tham số bắt buộc

Input the required parameters

  • token = Mã API bạn đã sao chép từ Bước 2.
  • email = Email liên kết với tài khoản SpeechGen của bạn từ Bước 2.
  • voice = Tên chính xác của giọng nói, bạn có thể chọn giọng nói mình thích từ danh sách giọng nói đầy đủ và sao chép tên giọng nói từ đó. Giọng nói API JSON https://speechgen.io/index.php?r=api/voices.
  • text = Văn bản bạn muốn chuyển thành giọng nói.

10. Nhấp vào OK để lưu các thay đổi

11. Chạy

Bây giờ là lúc để chạy và kiểm tra kịch bản của bạn.

Run your scenario

12. Nhấp vào bong bóng

Nhấp vào bong bóng này để xem kết quả yêu cầu của bạn.

Click on the bubble

Tập trung vào phần đầu ra, bạn sẽ thấy ‘Data’.

Bạn có thể thấy ‘id’ là ID của yêu cầu của chúng ta.

File ID

Bây giờ, để làm cho dữ liệu từ SpeechGen dễ dàng truy cập bởi các mô-đun khác, chúng ta có thể thêm một Mô-đun khác vào Kịch bản của mình.

13. Thêm một mô-đun khác

Di chuột đến bên cạnh mô-đun đầu tiên chúng ta có, bạn sẽ thấy một nút dấu cộng, nhấp vào đó.

next module

14. Thêm JSON

Tìm kiếm ‘JSON’ và chọn tùy chọn này.

Select json

Sau đó chọn Parse JSON để chúng ta có thể xuất dữ liệu từ SpeechGen thành nhiều biến mà chúng ta có thể sử dụng trong kịch bản của mình.

Select Parse JSON

15. Nhập ‘Data’

Nhấp vào đây để nhập ‘Data’ từ mô-đun HTTP trước đó.

Tnput Data

16. Nhấp ‘Data’

Nhấp ‘Data’ để thêm nó vào trường và nhấp OK để lưu các thay đổi.

Click Data

17. Chạy một lần

Nhấp Run Once để thực thi Kịch bản.

Click Run Once to execute the Scenario

Chọn ‘Run Anyway’ để buộc Make chạy Kịch bản.

Run Anyway

Điều này là do JSON không nên là mô-đun cuối cùng trong kịch bản, vì nó chuyển đổi dữ liệu từ một mô-đun khác và chúng ta không làm gì với dữ liệu đó, trong trường hợp này chúng ta chỉ muốn xem dữ liệu trước, sau đó quyết định làm gì với nó.

18. Nhấp vào bong bóng

Nhấp vào bong bóng phía trên mô-đun JSON để xem dữ liệu chúng ta nhận được.

Click the bubble above the JSON module

Bây giờ dữ liệu đã nằm dưới ‘Data’ hiện nằm trong các biến riêng lẻ mà chúng ta có thể sử dụng trong các mô-đun tiếp theo.

Bạn cũng có thể nhận thấy biến ‘ID’ mà chúng ta sẽ sử dụng trong các bước tiếp theo để lấy URL tệp TTS của chúng ta.

TTS File URL

19. Thêm Mô-đun SLEEP

Thêm một Mô-đun SLEEP để chờ TTS tạo ra.

Sleep

Click on the SLEEP

20. Đặt thời gian SLEEP

Đặt thời gian SLEEP từ 1-5 phút (60-300 giây).

Hãy đặt là 200 giây cho bản demo của chúng ta.

Set the SLEEP Duration

Bây giờ hãy tải tệp Mp3 đã tạo lên Dropbox, để làm điều đó chúng ta cần tải tệp Mp3 trong kịch bản này trước.

21. Thêm một Mô-đun HTTP khác

Thêm một Mô-đun HTTP khác để lấy TTS đã tạo.

Get the Generated TTS

Chèn các tham số cần thiết:

  • token = Mã API bạn đã sao chép từ Bước 2.
  • email = Email liên kết với tài khoản SpeechGen của bạn từ Bước 2.
  • id = ID của TTS từ yêu cầu đầu tiên [Parse JSON, bước 2].

22. Ánh xạ ID từ mô-đun JSON

Mapping the id from the JSON module

23. Lấy dữ liệu

Chạy kịch bản để lấy dữ liệu và thêm một mô-đun Parse JSON khác.

Parse JSON module

Ánh xạ ‘Data’ từ mô-đun HTTP trước đó.

23. Chạy lại kịch bản một lần nữa

Chạy lại kịch bản một lần nữa để lấy dữ liệu từ Mô-đun Parse JSON cuối cùng, sau đó thêm một Mô-đun HTTP khác để tải tệp xuống.

Add another HTTP Module

24. Chọn ‘Get File’

Chọn ‘Get File’ để chúng ta có thể tải tệp Mp3 xuống trong Kịch bản.

Select Get File

Hầu hết các mô-đun chỉ yêu cầu URL, nhưng DropBox yêu cầu nhập trực tiếp dữ liệu tệp thực tế.

25. Ánh xạ biến ‘file’

Ánh xạ biến ‘file’, đó là URL chúng ta có thể sử dụng để lấy tệp.

Map the file variable

26. Sau đó chúng ta sẽ thêm mô-đun DropBox

DropBox module

27. Chọn Tải tệp lên

Select Upload file

Chọn thư mục để lưu vào trong Dropbox của bạn, sau đó chọn Map để chúng ta có thể thay đổi tên của tệp Mp3 đã tải lên.

File

Đảm bảo bạn thêm phần mở rộng tệp ‘.mp3’ vào cuối tên, để Dropbox dễ dàng nhận ra đó là tệp Mp3 mà bạn có thể phát.

Mp3 file

Sau khi chạy Kịch bản, chúng ta có Tệp đã được tải lên DropBox.

The File uploaded to DropBox

Quy trình hoàn chỉnh cho phương pháp 2 bước

Scheme of the process

  1. HTTP: Tạo âm thanh từ văn bản bằng SpeechGen.io.
  2. JSON: Phân tích dữ liệu chúng ta nhận được từ API SpeechGen.
  3. SLEEP: Chờ vài phút cho đến khi TTS sẵn sàng.
  4. HTTP: Yêu cầu tệp mp3 bằng ID của nó.
  5. JSON: Phân tích dữ liệu như chúng ta đã làm trước đây.
  6. HTTP: Lấy dữ liệu nhị phân của tệp đã tạo.
  7. Dropbox: Tải dữ liệu đó lên Dropbox.

Kết luận

Tích hợp SpeechGen.io với Make.com mở ra nhiều khả năng rộng lớn để tự động hóa việc tạo nội dung giọng nói. Tự động hóa tổng hợp giọng nói có thể hữu ích cho:

  • Tạo phiên bản âm thanh của các bài báo hoặc blog.
  • Tạo thông báo giọng nói cho khách hàng.
  • Sản xuất tài liệu giáo dục và đào tạo ở định dạng âm thanh.
  • Nâng cao dịch vụ khách hàng bằng phản hồi giọng nói.

Cho dù bạn đang xử lý các thông báo ngắn hay tài liệu giáo dục dài, hướng dẫn của chúng tôi sẽ giúp bạn thiết lập một quy trình hiệu quả với nỗ lực tối thiểu. Chuyển đổi văn bản của bạn thành giọng nói sống động một cách tự động, làm cho nội dung của bạn dễ tiếp cận và hấp dẫn hơn đối với nhiều đối tượng.

Chúng tôi sử dụng cookie để đảm bảo bạn có được trải nghiệm tốt nhất trên trang web của chúng tôi. Tìm hiểu thêm: Chính sách quyền riêng tư

Chấp nhận cookie