使用独有的智能缓存技术，免费合成语音

22-09-2025 , 22-09-2025

Speechgen 提供独特的经济型缓存功能，可显著减少文本转语音转换的时间和成本。在本文中，我们将探讨此功能的工作原理、优势以及如何帮助您在配音时节省费用。

经济型缓存如何工作

当您合成语音时，Speechgen 会记住每个句子的结果。例如：

您配了 30 个句子。
然后您又添加了 10 个句子并重新配音。
Speechgen 将从内存中提取已配音的 30 个句子，为这 10 个新句子配音，并将它们合并成一个文件。

优势：

配音时间更短
已配音句子的额度节省

使用示例

想象一下，您正在为一个包含 20 课的教育课程配音。完成工作后，您决定为每课添加一个简短的介绍。使用常规服务，您将不得不重新配音所有内容，这将产生高昂的费用。使用 Speechgen，您只需为新添加的介绍付费，从而节省资源和时间。

以下是 Speechgen 与其他服务的比较：

示例	其他文本转语音服务	Speechgen
示例 #1：30 个句子	100% 费用	100% 费用
示例 #2：30 个句子 + 10 个新句子	100% 费用	25% 费用

使用其他语音合成服务，每次配音都会产生已配音内容的 100% 费用。使用 Speechgen，只有新句子或更改的句子才会被配音。如表格所示，在重复配音时，Speechgen 只使用了总字符数的 25%，而不是 100%，因为 75% 的文本是从先前配音的内容中获取的。

这意味着您无需担心修改文本时重复产生费用。您可以稍后返回您的文本并进行编辑。

条款和限制

文本量：对于相同的设置和说话人，最多可达 100,000 个字符。
存储时长：经济型缓存存储 1 周。
缓存单位：保存的是整个句子，而不是单个单词。

详细操作

文本量高达 100,000 个字符

超过此数量时，将使用图书模式来更快地配音大量文本，通过大文本块而不是句子进行处理。Speechgen 一次最多可配音 2,000,000 个字符，但经济型缓存最多支持 100,000 个字符。

经济型缓存存储 1 周

配音的句子仅在内存中存储 1 周。您有 7 天的时间来补充或修改配音。此外，在您的个人资料中，完整的配音历史记录会存储 30 天。这意味着您可以在 30 天内下载完整的文本和文件。但是，缓存本身仅存储 7 天。

如果您决定在 25 天后对配音进行补充，则整个项目的额度将再次被扣除。通过将配音保存到收藏夹，您可以永久保留音频和文本，但缓存仍只存储 7 天。

您的文本和音频文件会保存在您的个人资料中，但缓存不会，因此在工作时请牢记这一点。

什么构成文本更改

缓存仅对未更改的句子有效。如果您更改了一个字母或删除了句子中的逗号，系统会将其视为新句子。

示例

添加新句子：

原始文本：

人工智能正在改变世界。
技术正以前所未有的速度发展。
我们期待的未来已经到来。

添加新句子：

我们必须为变化做好准备。

结果：Speechgen 从缓存中获取前三个句子，只为第四个句子配音。费用仅针对第四个句子产生。

更改一个单词：

原始文本：

人工智能正在改变世界。
技术正以前所未有的速度发展。
我们期待的未来已经到来。

更改第二个句子中的一个单词：

技术正以令人惊讶的速度发展。

结果：Speechgen 从缓存中获取第一个和第三个句子，但会重新配音第二个句子。

删除逗号：

原始文本：

人工智能正在改变世界。
技术正以前所未有的速度发展。
我们期待的未来，已经到来。

删除第三个句子中的逗号：

我们期待的未来已经到来。

结果：Speechgen 将重新配音第三个句子，并从缓存中获取第一个和第二个句子。由于删除了逗号，第三个句子被视为已更改。

其他更改

添加 <break>

如果您添加新的停顿标签，例如 break，这也将被视为对句子的更改。系统将重新分析并重新配音。

<break time="200ms"/>

实际上，句子是根据字符的完全匹配从经济型缓存中检索的。如果存在任何新字符或句子中缺少某个字符，程序将无法精确匹配。

更改语速、语调和说话人

如果您更改语速或语调设置，这将是一次全新的配音，经济型缓存将不起作用。当您更改语速或语调时，神经网络会使用这些新参数重新配音文本。这不是软件加速或语调更改；这是完全的重新配音。

更改说话人也会导致完全重新配音。在这种情况下，神经网络会重新完成所有工作。因此，如果您要调整声音，请对 1-2 个句子进行此操作，一旦您对语速和语调满意，再为整个所需文本配音。

可以更改什么

加速和减慢字幕中的语音

在此特殊页面 https://speechgen.io/zh/subs/ 上，您可以为字幕配音。为了匹配时间，通常需要加快语速以满足所需的时间要求。在这种情况下，经济型缓存会起作用，因为 Speechgen 会先配音，然后通过程序加速字幕。

更改设置中的停顿

您可以在配音字段下的设置中更改停顿，缓存将完美运行。我们将整个句子保存在内存中，然后系统将它们合并成音频。这样，您可以调整句子或段落之间的停顿，而无需额外费用。

更改格式

如果您选择不同的格式 — ogg、wav、opus — 并按“重新配音”，系统将不会向您收取任何额度。这是免费的。如果您已配音但后来发现需要不同的格式，请更改它，而无需担心重复收费。

更改采样率

如果您在设置中更改采样率并再次按“重新配音”，系统将不会向您收取任何额度。这是免费的。

结论

Speechgen 的经济型缓存系统提供了显著的优势：

节省资源：只为新内容付费，而不是为整个文本重新付费。
工作更快捷：重复配音速度更快。
灵活性：无需担心额外费用即可尝试修改您的文本。

Speechgen 可节省您的资源，并提供更高效处理音频内容的工具，是重视语音合成效率和质量的用户的理想选择。

使用独有的智能缓存技术，免费合成语音

经济型缓存如何工作

优势：

使用示例

条款和限制

详细操作

文本量高达 100,000 个字符

经济型缓存存储 1 周

什么构成文本更改

示例

添加新句子：

更改一个单词：

删除逗号：

其他更改

添加 <break>

更改语速、语调和说话人

可以更改什么

加速和减慢字幕中的语音

更改设置中的停顿

更改格式

更改采样率

结论

我们推荐