使用独有的智能缓存技术,免费合成语音

, 22-09-2025

Speechgen 提供独特的经济型缓存功能,可显著减少文本转语音转换的时间和成本。在本文中,我们将探讨此功能的工作原理、优势以及如何帮助您在配音时节省费用。

经济型缓存如何工作

当您合成语音时,Speechgen 会记住每个句子的结果。例如

  • 您配了 30 个句子。
  • 然后您又添加了 10 个句子并重新配音。
  • Speechgen 将从内存中提取已配音的 30 个句子,为这 10 个新句子配音,并将它们合并成一个文件。

优势:

  • 配音时间更短
  • 已配音句子的额度节省

使用示例

想象一下,您正在为一个包含 20 课的教育课程配音。完成工作后,您决定为每课添加一个简短的介绍。使用常规服务,您将不得不重新配音所有内容,这将产生高昂的费用。使用 Speechgen,您只需为新添加的介绍付费,从而节省资源和时间。

以下是 Speechgen 与其他服务的比较:

示例

其他文本转语音服务

Speechgen

示例 #1:30 个句子

100% 费用

100% 费用

示例 #2:30 个句子 + 10 个新句子

100% 费用

25% 费用

使用其他语音合成服务,每次配音都会产生已配音内容的 100% 费用。使用 Speechgen,只有新句子或更改的句子才会被配音。如表格所示,在重复配音时,Speechgen 只使用了总字符数的 25%,而不是 100%,因为 75% 的文本是从先前配音的内容中获取的。

这意味着您无需担心修改文本时重复产生费用。您可以稍后返回您的文本并进行编辑。

条款和限制

  • 文本量:对于相同的设置和说话人,最多可达 100,000 个字符。
  • 存储时长:经济型缓存存储 1 周。
  • 缓存单位:保存的是整个句子,而不是单个单词。

详细操作

文本量高达 100,000 个字符

超过此数量时,将使用图书模式来更快地配音大量文本,通过大文本块而不是句子进行处理。Speechgen 一次最多可配音 2,000,000 个字符,但经济型缓存最多支持 100,000 个字符。

经济型缓存存储 1 周

配音的句子仅在内存中存储 1 周。您有 7 天的时间来补充或修改配音。此外,在您的个人资料中,完整的配音历史记录会存储 30 天。这意味着您可以在 30 天内下载完整的文本和文件。但是,缓存本身仅存储 7 天。

如果您决定在 25 天后对配音进行补充,则整个项目的额度将再次被扣除。通过将配音保存到收藏夹,您可以永久保留音频和文本,但缓存仍只存储 7 天。

您的文本和音频文件会保存在您的个人资料中,但缓存不会,因此在工作时请牢记这一点。

什么构成文本更改

缓存仅对未更改的句子有效。如果您更改了一个字母或删除了句子中的逗号,系统会将其视为新句子。

示例

添加新句子:

原始文本:

  • 人工智能正在改变世界。
  • 技术正以前所未有的速度发展。
  • 我们期待的未来已经到来。

添加新句子:

  • 我们必须为变化做好准备

结果:Speechgen 从缓存中获取前三个句子,只为第四个句子配音。费用仅针对第四个句子产生。

更改一个单词:

原始文本:

  • 人工智能正在改变世界。
  • 技术正以前所未有的速度发展。
  • 我们期待的未来已经到来。

更改第二个句子中的一个单词:

  • 技术正以令人惊讶的速度发展。

结果:Speechgen 从缓存中获取第一个和第三个句子,但会重新配音第二个句子。

删除逗号:

原始文本:

  • 人工智能正在改变世界。
  • 技术正以前所未有的速度发展。
  • 我们期待的未来已经到来

删除第三个句子中的逗号:

  • 我们期待的未来已经到来

结果:Speechgen 将重新配音第三个句子,并从缓存中获取第一个和第二个句子。由于删除了逗号,第三个句子被视为已更改。

其他更改

添加 <break>

如果您添加新的停顿标签,例如 break,这也将被视为对句子的更改。系统将重新分析并重新配音。

<break time="200ms"/>

实际上,句子是根据字符的完全匹配从经济型缓存中检索的。如果存在任何新字符或句子中缺少某个字符,程序将无法精确匹配。

更改语速、语调和说话人

如果您更改语速或语调设置,这将是一次全新的配音,经济型缓存将不起作用。当您更改语速或语调时,神经网络会使用这些新参数重新配音文本。这不是软件加速或语调更改;这是完全的重新配音。

更改说话人也会导致完全重新配音。在这种情况下,神经网络会重新完成所有工作。因此,如果您要调整声音,请对 1-2 个句子进行此操作,一旦您对语速和语调满意,再为整个所需文本配音。

可以更改什么

加速和减慢字幕中的语音

在此特殊页面 https://speechgen.io/zh/subs/ 上,您可以为字幕配音。为了匹配时间,通常需要加快语速以满足所需的时间要求。在这种情况下,经济型缓存会起作用,因为 Speechgen 会先配音,然后通过程序加速字幕。

更改设置中的停顿

您可以在配音字段下的设置中更改停顿,缓存将完美运行。我们将整个句子保存在内存中,然后系统将它们合并成音频。这样,您可以调整句子或段落之间的停顿,而无需额外费用。

更改格式

如果您选择不同的格式 — ogg、wav、opus — 并按“重新配音”,系统将不会向您收取任何额度。这是免费的。如果您已配音但后来发现需要不同的格式,请更改它,而无需担心重复收费。

更改采样率

如果您在设置中更改采样率并再次按“重新配音”,系统将不会向您收取任何额度。这是免费的。

结论

Speechgen 的经济型缓存系统提供了显著的优势:

  • 节省资源:只为新内容付费,而不是为整个文本重新付费。
  • 工作更快捷:重复配音速度更快。
  • 灵活性:无需担心额外费用即可尝试修改您的文本。

Speechgen 可节省您的资源,并提供更高效处理音频内容的工具,是重视语音合成效率和质量的用户的理想选择。

我们使用Cookie来确保您在我们的网站上获得最佳体验。了解更多:隐私政策

接受Cookies