27-10-2025 , 27-10-2025

简化语音内容创作:将 SpeechGen.io 与 Make.com 集成。这篇博文将指导您如何将自动化服务 Make.com(前身为 Integromat)与我们基于神经网络的语音合成服务 SpeechGen.io 进行集成。这种集成可以实现文本转语音流程的自动化,使内容创作更简单、更高效。
我们根据您要转换为语音的文本长度提供两种方法:
对于 2000 字符以内的文本:此方法涉及快速请求和即时接收语音输出。它非常适合需要快速转换的短文本。
对于 2000 字符以上的文本:此方法使用两次请求。第一次请求发送带有语音设置的文本进行转换。第二次请求应在至少一分钟后发出,以检索完成的音频文件。这种方法确保长文本能够高效处理,而不会使系统过载。
Make.com 简化了这些流程的自动化,无需深厚的技术知识。您可以设置触发器,在满足特定条件时自动启动文本转语音流程,例如将新文本添加到您的 CMS 或数据库时。
要开始集成,您需要熟悉我们的 API。您可以在SpeechGen.io API 常见问题中找到所有必要信息,包括文档和常见问题解答。
在这篇博文中,我们将学习如何使用 SpeechGen 从文本生成 Mp3 文件,然后将该 Mp3 文件上传到 DropBox。
您可以下载并导入此博客中显示的演示项目 json 并使用它。

登录 Make.com 并点击“创建新场景”。


搜索“HTTP”并从可用模块列表中选择“HTTP”。


输入 URL 为 https://speechgen.io/index.php?r=api/text
然后点击“添加参数”以向我们的请求添加查询参数

我们总共需要输入 4 个参数,所以让我们再添加 3 个。



现在是时候运行和测试您的场景了。

点击此气泡以查看您的请求结果。

关注输出部分,您会看到“数据”。
您可以看到“文件”,它是我们生成的文本 Mp3 文件的 URL

如果您导航到此 URL,您可以播放和下载 Mp3 文件。
为了使 SpeechGen 的数据易于其他模块访问,我们可以向我们的场景添加另一个模块。
将鼠标悬停在我们第一个模块旁边,您会看到一个加号按钮,点击它

搜索“JSON”并选择此选项。

然后选择“解析 JSON”,这样我们就可以将 SpeechGen 的数据导出到我们可以在场景中使用的多个变量中。

点击此处(JSON 字符串)输入来自上一个 HTTP 模块的“数据”

点击“数据”将其添加到字段中,然后点击“确定”保存更改。

点击“运行一次”以执行场景。

选择“无论如何运行”以强制 Make 运行场景。

这是因为 JSON 不应该是场景中的最后一个模块,因为它转换了来自另一个模块的数据,而我们没有对这些数据做任何事情,在这种情况下,我们只是想先查看数据,然后决定如何处理它。
点击 JSON 模块上方的气泡以查看我们获得的数据。

现在,所有在“数据”下的数据都已成为单独的变量,我们可以在下一个模块中使用它们……
您还可以注意到“文件”变量,其中包含生成的 Mp3 文件的 URL,我们将在下一个模块中使用它。

现在让我们将生成的 Mp3 文件上传到 Dropbox,为此,我们首先需要在此场景中下载 Mp3 文件。

选择“获取文件”,这样我们就可以在场景中下载 Mp3 文件。

大多数模块只需要 URL,但 DropBox 需要直接输入实际文件数据。
映射“文件”变量,它是我们可以用来获取文件的 URL。

然后我们将添加 DropBox 模块。


选择要保存到 Dropbox 中的文件夹,然后选择“映射”以更改上传的 Mp3 文件的名称。

确保在名称末尾添加“.mp3”文件扩展名,这样 Dropbox 就能更容易地将其识别为可播放的 Mp3 文件。

运行场景后,文件已上传到 DropBox


现在,我们正在利用 SpeechGen 的长文本 API 来生成长 TTS。
第二种方法专为超过 2000 个字符的文本设计。与第一种快速将短文本转换为语音的方法不同,由于处理长文本所需的时间,此方法涉及两个步骤。
与第一种方法的主要区别在于,由于处理时间较长,需要进行第二次请求。此方法确保高效处理大量文本,使其适用于创建较长的音频内容。
然后我们将文件上传到 Dropbox 作为演示,但如何使用此 TTS API 的选项是无限的。
您可以下载并导入此博客中显示的用于长文本的演示蓝图 json 并使用它。

登录 Make.com 并点击“创建新场景”。


搜索“HTTP”并从可用模块列表中选择“HTTP”。


输入网址为 https://speechgen.io/index.php?r=api/longtext
然后点击“添加参数”为我们的请求添加查询参数。

我们需要总共输入4个参数,所以我们再添加3个。


现在是时候运行并测试您的场景了。

点击此气泡查看您的请求结果。

关注输出部分,您会看到“数据”。
您可以看到“id”,这是我们请求的ID。

现在,为了让SpeechGen的数据更容易被其他模块访问,我们可以在场景中添加另一个模块。
将鼠标悬停在我们第一个模块旁边,您会看到一个加号按钮,点击它。

搜索“JSON”并选择此选项。

然后选择“解析JSON”,这样我们就可以将SpeechGen的数据导出为多个变量,以便在我们的场景中使用。

点击此处输入来自上一个HTTP模块的“数据”。

点击“数据”将其添加到字段中,然后点击“确定”保存更改。

点击“运行一次”执行场景。

选择“无论如何运行”以强制Make运行场景。

这是因为JSON不应该是场景中的最后一个模块,因为它转换了来自另一个模块的数据,而我们没有对这些数据做任何处理。在这种情况下,我们只是想先查看数据,然后决定如何处理它。
点击JSON模块上方的气泡,查看我们获取的数据。

现在,所有在“数据”下的数据都已转换为单独的变量,我们可以在后续模块中使用。
您还可以注意到“ID”变量,我们将在后续步骤中使用它来获取我们的TTS文件网址。

添加一个“暂停”模块,等待TTS生成。


将“暂停”持续时间设置为1-5分钟(60-300秒)。
在我们的演示中,我们将其设置为200秒。

现在,让我们将生成的Mp3文件上传到Dropbox。为此,我们首先需要在该场景中下载Mp3文件。
添加另一个HTTP模块以获取生成的TTS。

插入必要的参数:

运行场景以获取数据,并添加另一个“解析JSON”模块。

映射来自上一个HTTP模块的“数据”。
再次运行场景以从最后一个“解析JSON”模块获取数据,然后添加另一个HTTP模块以下载文件。

选择“获取文件”,以便我们可以在场景中下载Mp3文件。

大多数模块只需要网址,但Dropbox需要直接输入实际文件数据。
映射“文件”变量,这是我们可以用来获取文件的网址。



选择要保存到Dropbox中的文件夹,然后选择“映射”以便我们可以更改上传的Mp3文件的名称。

请确保在名称末尾添加“.mp3”文件扩展名,这样Dropbox更容易将其识别为可播放的Mp3文件。

运行场景后,我们已将文件上传到Dropbox。

将SpeechGen.io与Make.com集成,为自动化语音内容创作开辟了广阔的可能性。自动化语音合成可用于:
无论您处理的是简短通知还是冗长的教育材料,我们的指南都将帮助您以最少的精力建立高效的流程。自动将您的文本转换为生动的语音,使您的内容更易于访问并吸引更广泛的受众。