SpeechGen API 与 Make.com 集成:自动化文本转语音工作流程

, 27-10-2025

简化语音内容创作:将 SpeechGen.io 与 Make.com 集成。这篇博文将指导您如何将自动化服务 Make.com(前身为 Integromat)与我们基于神经网络的语音合成服务 SpeechGen.io 进行集成。这种集成可以实现文本转语音流程的自动化,使内容创作更简单、更高效。

工作原理

我们根据您要转换为语音的文本长度提供两种方法:

  1. 对于 2000 字符以内的文本:此方法涉及快速请求和即时接收语音输出。它非常适合需要快速转换的短文本。

  2. 对于 2000 字符以上的文本:此方法使用两次请求。第一次请求发送带有语音设置的文本进行转换。第二次请求应在至少一分钟后发出,以检索完成的音频文件。这种方法确保长文本能够高效处理,而不会使系统过载。

为什么要使用 Make.com?

Make.com 简化了这些流程的自动化,无需深厚的技术知识。您可以设置触发器,在满足特定条件时自动启动文本转语音流程,例如将新文本添加到您的 CMS 或数据库时。

开始使用

要开始集成,您需要熟悉我们的 API。您可以在SpeechGen.io API 常见问题中找到所有必要信息,包括文档和常见问题解答。

完整视频指南

1. 短文本方法

在这篇博文中,我们将学习如何使用 SpeechGen 从文本生成 Mp3 文件,然后将该 Mp3 文件上传到 DropBox。

您可以下载并导入此博客中显示的演示项目 json 并使用它。

1. 要求

2. 获取您的 SpeechGen API 密钥

  1. 登录您的 SpeechGen.io 个人资料
  2. 导航到您的个人资料
  3. 显示并复制您的 API 密钥。我们稍后会用到它。

Speechgen API Key

3. 创建新场景

登录 Make.com 并点击“创建新场景”。

Create a new scenario

4. 添加新模块

Add a new Module

5. 选择 HTTP

搜索“HTTP”并从可用模块列表中选择“HTTP”。

Select HTTP from the list

6. 选择“发出请求”

Select Make a request

7. 输入 URL

输入 URL 为 https://speechgen.io/index.php?r=api/text

然后点击“添加参数”以向我们的请求添加查询参数

Input URL

8. 插入 3 个额外参数

我们总共需要输入 4 个参数,所以让我们再添加 3 个。

Add parameter 3 more

9. 输入所需参数

Input the required parameters

  • token = 您从步骤 2 复制的 API 令牌
  • email = 与您的 SpeechGen 账户关联的电子邮件
  • voice = 语音的确切名称,您可以从完整语音列表中选择您喜欢的语音并从那里复制语音名称。JSON API 语音 https://speechgen.io/index.php?r=api/voices
  • text = 您要转换为语音的文本。例如,我将粘贴以下文本:“一种实用的解决方案,用于创建画外音、电子学习材料和广告。以多种语言和口音从文本生成语音。自定义语音设置以满足特定需求”

10. 点击“确定”保存更改

OK to save the changes

11. 运行您的场景

现在是时候运行和测试您的场景了。

Run your scenario

12. 点击气泡

点击此气泡以查看您的请求结果。

Click on the bubble

关注输出部分,您会看到“数据”。

您可以看到“文件”,它是我们生成的文本 Mp3 文件的 URL

generated Mp3 file

如果您导航到此 URL,您可以播放和下载 Mp3 文件。

为了使 SpeechGen 的数据易于其他模块访问,我们可以向我们的场景添加另一个模块。

14. 添加另一个模块

将鼠标悬停在我们第一个模块旁边,您会看到一个加号按钮,点击它

next  module

15. 选择“JSON”选项

搜索“JSON”并选择此选项。

Select json

16. 选择“解析 JSON”

然后选择“解析 JSON”,这样我们就可以将 SpeechGen 的数据导出到我们可以在场景中使用的多个变量中。

Select Parse JSON

17. 输入“数据”

点击此处(JSON 字符串)输入来自上一个 HTTP 模块的“数据

Tnput Data

18. 点击“数据”

点击“数据”将其添加到字段中,然后点击“确定”保存更改。

Click Data

19. 运行一次

点击“运行一次”以执行场景。

Click Run Once to execute the Scenario

选择“无论如何运行”以强制 Make 运行场景。

Run Anyway

这是因为 JSON 不应该是场景中的最后一个模块,因为它转换了来自另一个模块的数据,而我们没有对这些数据做任何事情,在这种情况下,我们只是想先查看数据,然后决定如何处理它。

20. 点击气泡

点击 JSON 模块上方的气泡以查看我们获得的数据。

Click the bubble above the JSON module

现在,所有在“数据”下的数据都已成为单独的变量,我们可以在下一个模块中使用它们……

您还可以注意到“文件”变量,其中包含生成的 Mp3 文件的 URL,我们将在下一个模块中使用它。

Notice the file

现在让我们将生成的 Mp3 文件上传到 Dropbox,为此,我们首先需要在此场景中下载 Mp3 文件。

21. 添加另一个 HTTP 模块以下载文件

Add another HTTP Module

选择“获取文件”,这样我们就可以在场景中下载 Mp3 文件。

Select Get File

大多数模块只需要 URL,但 DropBox 需要直接输入实际文件数据。

22. 映射“文件”变量

映射“文件”变量,它是我们可以用来获取文件的 URL。

Map the file variable

23. DropBox 模块

然后我们将添加 DropBox 模块。

DropBox module

24. 选择“上传文件”

Select Upload file

选择要保存到 Dropbox 中的文件夹,然后选择“映射”以更改上传的 Mp3 文件的名称。

File

确保在名称末尾添加“.mp3”文件扩展名,这样 Dropbox 就能更容易地将其识别为可播放的 Mp3 文件。

Mp3 file

运行场景后,文件已上传到 DropBox

The File uploaded to DropBox

第一种方法的完整流程

A preview of the entire process

  1. HTTP:使用 SpeechGen.io 从文本生成音频
  2. JSON:解析我们从 SpeechGen API 获取的数据
  3. HTTP:获取生成文件的二进制数据
  4. Dropbox:将数据上传到 Dropbox

2. 长文本方法

现在,我们正在利用 SpeechGen 的长文本 API 来生成长 TTS。

第二种方法专为超过 2000 个字符的文本设计。与第一种快速将短文本转换为语音的方法不同,由于处理长文本所需的时间,此方法涉及两个步骤。

  1. 初始请求:您发送带有选定语音设置的文本以开始转换过程。
  2. 后续请求:等待至少一分钟后,您发出另一个请求以检索完成的音频文件。此延迟确保系统有足够的时间处理长文本而不会出现任何问题。

与第一种方法的主要区别在于,由于处理时间较长,需要进行第二次请求。此方法确保高效处理大量文本,使其适用于创建较长的音频内容。

然后我们将文件上传到 Dropbox 作为演示,但如何使用此 TTS API 的选项是无限的。

您可以下载并导入此博客中显示的用于长文本的演示蓝图 json 并使用它。

1. 要求

2. 获取您的 SpeechGen API 密钥

  1. 登录您的 SpeechGen.io 个人资料
  2. 导航到您的个人资料
  3. 显示并复制您的 API 密钥。我们稍后会用到它。

Speechgen API Key

3. 创建新场景

登录 Make.com 并点击“创建新场景”。

Create a new scenario

4. 添加新模块

Add a new Module

5. 选择 HTTP

搜索“HTTP”并从可用模块列表中选择“HTTP”。

Select HTTP from the list

6. 选择“发出请求”

Select Make a request

7. 输入网址

输入网址为 https://speechgen.io/index.php?r=api/longtext

然后点击“添加参数”为我们的请求添加查询参数。

Input URL

8. 输入4个参数

我们需要总共输入4个参数,所以我们再添加3个。

Add parameter 3 more

9. 输入所需参数

Input the required parameters

  • token = 您从第2步复制的API令牌。
  • email = 与您在第2步的SpeechGen账户关联的电子邮件。
  • voice = 语音的确切名称。您可以从完整语音列表中选择您喜欢的语音,并从那里复制语音名称。JSON API语音:https://speechgen.io/index.php?r=api/voices
  • text = 您想要转换为语音的文本。

10. 点击“确定”保存更改

11. 运行

现在是时候运行并测试您的场景了。

Run your scenario

12. 点击气泡

点击此气泡查看您的请求结果。

Click on the bubble

关注输出部分,您会看到“数据”。

您可以看到“id”,这是我们请求的ID。

File ID

现在,为了让SpeechGen的数据更容易被其他模块访问,我们可以在场景中添加另一个模块。

13. 添加另一个模块

将鼠标悬停在我们第一个模块旁边,您会看到一个加号按钮,点击它。

next  module

14. 添加JSON

搜索“JSON”并选择此选项。

Select json

然后选择“解析JSON”,这样我们就可以将SpeechGen的数据导出为多个变量,以便在我们的场景中使用。

Select Parse JSON

15. 输入“数据”

点击此处输入来自上一个HTTP模块的“数据”。

Tnput Data

16. 点击“数据”

点击“数据”将其添加到字段中,然后点击“确定”保存更改。

Click Data

17. 运行一次

点击“运行一次”执行场景。

Click Run Once to execute the Scenario

选择“无论如何运行”以强制Make运行场景。

Run Anyway

这是因为JSON不应该是场景中的最后一个模块,因为它转换了来自另一个模块的数据,而我们没有对这些数据做任何处理。在这种情况下,我们只是想先查看数据,然后决定如何处理它。

18. 点击气泡

点击JSON模块上方的气泡,查看我们获取的数据。

Click the bubble above the JSON module

现在,所有在“数据”下的数据都已转换为单独的变量,我们可以在后续模块中使用。

您还可以注意到“ID”变量,我们将在后续步骤中使用它来获取我们的TTS文件网址。

TTS File URL

19. 添加一个“暂停”模块

添加一个“暂停”模块,等待TTS生成。

Sleep

Click on the SLEEP

20. 设置“暂停”时间

将“暂停”持续时间设置为1-5分钟(60-300秒)。

在我们的演示中,我们将其设置为200秒。

Set the SLEEP Duration

现在,让我们将生成的Mp3文件上传到Dropbox。为此,我们首先需要在该场景中下载Mp3文件。

21. 添加另一个HTTP模块

添加另一个HTTP模块以获取生成的TTS。

Get the Generated TTS

插入必要的参数:

  • token = 您从第2步复制的API令牌。
  • email = 与您在第2步的SpeechGen账户关联的电子邮件。
  • id = 来自第一个请求的TTS ID [解析JSON,第2步]。

22. 映射JSON模块中的ID

Mapping the id from the JSON module

23. 获取数据

运行场景以获取数据,并添加另一个“解析JSON”模块。

Parse JSON module

映射来自上一个HTTP模块的“数据”。

23. 再次运行场景

再次运行场景以从最后一个“解析JSON”模块获取数据,然后添加另一个HTTP模块以下载文件。

Add another HTTP Module

24. 选择“获取文件”

选择“获取文件”,以便我们可以在场景中下载Mp3文件。

Select Get File

大多数模块只需要网址,但Dropbox需要直接输入实际文件数据。

25. 映射“文件”变量

映射“文件”变量,这是我们可以用来获取文件的网址。

Map the file variable

26. 然后我们将添加Dropbox模块

DropBox module

27. 选择“上传文件”

Select Upload file

选择要保存到Dropbox中的文件夹,然后选择“映射”以便我们可以更改上传的Mp3文件的名称。

File

请确保在名称末尾添加“.mp3”文件扩展名,这样Dropbox更容易将其识别为可播放的Mp3文件。

Mp3 file

运行场景后,我们已将文件上传到Dropbox。

The File uploaded to DropBox

2D方法的完整流程

Scheme of the process

  1. HTTP:使用SpeechGen.io从文本生成音频。
  2. JSON:解析我们从SpeechGen API获取的数据。
  3. 暂停:等待几分钟直到TTS准备就绪。
  4. HTTP:使用其ID请求mp3文件。
  5. JSON:像之前一样解析数据。
  6. HTTP:获取生成文件的二进制数据。
  7. Dropbox:将该数据上传到Dropbox。

结论

将SpeechGen.io与Make.com集成,为自动化语音内容创作开辟了广阔的可能性。自动化语音合成可用于:

  • 创建文章或博客的音频版本。
  • 为客户生成语音通知。
  • 制作音频格式的教育和培训材料。
  • 通过语音回复增强客户服务。

无论您处理的是简短通知还是冗长的教育材料,我们的指南都将帮助您以最少的精力建立高效的流程。自动将您的文本转换为生动的语音,使您的内容更易于访问并吸引更广泛的受众。

我们使用Cookie来确保您在我们的网站上获得最佳体验。了解更多:隐私政策

接受Cookies