一次合成切分成多个音频片段

15-09-2025 , 27-04-2026

用 <cut/> 标签把一次合成切分成多个可下载的音频片段。点一次转换,就能为文本里的每一段生成干净、独立命名的文件 —— 不用 Audacity,也不用手动切分。

工作原理 · SpeechGen 将整段文本一次性合成,以保持节奏和语调的连贯;然后在每一个 <cut/> 标签处切开音频。可以通过工具栏一键插入标签,也可以手动输入。添加 name 属性即可自定义文件名 —— 任意字母都支持,包括带变音符号的拉丁文、西里尔文、中文和阿拉伯文。

0:00 / 0:00

完整演示 —— 空编辑器、输入文本、点击两次切分、合成,然后添加自定义名称。

01

从一个空编辑器开始

光标在行首闪烁 —— 已准备好接受脚本。

空编辑器,光标闪烁

02

输入文本,把光标放在分割点上

写下脚本 —— 段落、章节、播客开场,任何项目所需的内容都行。然后把光标放在一个片段结束、下一个片段开始的位置。

输入了三段有声书章节;光标位于第一章和第二章之间

03

点击工具栏里的切分按钮

切分按钮就在编辑器工具栏里 —— SSML 旁边那个小剪刀图标。点一下,光标位置就会插入一个 <cut/> 标签。在下一个分割点重复操作,添加第二个切分点。两个切分点意味着三个片段。

编辑器工具栏中切分按钮高亮显示(悬停状态)

建议上限:每个项目 1,000 个短片段,或较长片段 500 个。

04

按下转换 —— 出来三个自动命名的片段

SpeechGen 将整段文本作为一次完整合成来渲染(这样片段之间的节奏和语调能保持一致),然后在每一个 <cut/> 标签处切开音频。每个片段都根据其文本开头几个词自动命名 —— 例如 {projectId}_1_chapter-one-the-journey-begins。

第一次转换后产生的三个片段

结果区出现两个新按钮:下载所有片段(zip) 一次性获取全部文件;箭头按钮展开列表,每一行可单独下载相应片段。

05

想要自定义文件名?加一个 `name` 属性

直接在任意 <cut/> 标签里输入 name 属性。任意字母、标点或非拉丁字母都能用 —— 带变音符号的拉丁文、西里尔文、中文、阿拉伯文 —— 每一个 Unicode 字符都会保留在文件名中:

<cut name="chapter-1"/> <cut name="chapter-2"/>

name 属于在此标签结束的那个片段。所以,在第一个切分点写 name="chapter-1",会重命名第一个片段。

两个 cut 标签都已输入 name 属性

06

再次转换 —— 片段现在用上了自定义名称

按下转换。同样的文本会重新渲染(如果未改变,则从缓存读取),然后再次切分 —— 这次带名字的切分点会生成 chapter-1.mp3 和 chapter-2.mp3,而不是自动生成的名称。

转换为语音按钮高亮显示

如果只改了文件名再合成同样的文本,SpeechGen 会识别出音频未变,不会额外消耗配额。

07

一次性全部下载,或者逐个下载

结果面板有两种下载选项:① 下载所有片段(zip) 一次性获取全部文件 —— 非常适合批量工作流。② 箭头按钮展开列表,列出每个片段并附带各自的下载按钮。

结果面板上下载片段按钮和箭头按钮高亮显示

08

每个片段都用上设定的名字

列表展示了每个片段的时长和下载按钮。自定义命名的片段 —— 例如高亮显示的 chapter-1 和 chapter-2 行 —— 保留了输入时的完整名字。自动命名的片段则取自文本开头几个词。

片段列表中 chapter-1 和 chapter-2 行高亮显示

默认文件名格式:{projectId}_{position}_{transliterated-text}。带上 name="...",文件名就和输入的完全一致。

合成结果

听一下合成出来的效果 —— 三段有声书章节在一次渲染里完成,然后被切分成独立文件:

三个章节 · Chuntao

3 个片段 · 约 9 秒

在编辑器中打开此示例

自定义文件名细节

cut 标签上的 name 属性会作为对应片段的输出文件名。标签必须位于想要命名的那个片段的末尾。

…<cut name="part1"/> …<cut name="Gilderbloom_cite"/> …<cut name="Oscar Wilde"/> …<cut name="rozdział-2"/>

可以使用空格、连字符、下划线和任何 Unicode 字符。如果不加 name,SpeechGen 会根据片段开头几个词自动生成名字。

如果只改了文件名再合成同样的文本,系统会复用已有音频,不会额外扣配额 —— 在大批量调整命名时很方便。

片段数量上限

每个配音项目最多支持 1,000 个短片段 或 500 个较长片段。如果输出中出现空片段,说明已经触达上限 —— 把文本拆成两个独立项目即可恢复。

使用场景

任何原本要在 Audacity 或 DAW 里手动切分音频的场合都能用。以下并非全部:

教育

有声书章节或段落区块
按主题或子主题切分的音频课程
外语学习模块(词汇、对话、练习)
按题目切分的音频测验
讲座、研讨会、远程教学模块

媒体与娱乐

播客开场、段落、赞助商口播、片尾 —— 每段一个干净的文件
从 Google Sheet 批量配音的电影台词
广播剧、舞台剧、独立游戏的分场景音频
从一次渲染产出多种长度的预告片配音

旅游与出行

旅游线路的语音导览(每个景点一个文件)
机上安全广播分段
酒店各项服务的欢迎语
国家公园步道的解说

商业与健康

员工入职培训模块
产品或服务讲解文件
客户评价或推荐合集(每条一个片段)
按阶段切分的呼吸或冥想引导课程
按动作切分的患者康复训练音频

如果一次要命名几十个片段,可以配合一份 Google 表格模板一起使用。

由 SpeechGen.io 制作 · 现在已经掌握了如何把一次合成切分成多个干净的文件。可以搭配 dialog 标签来做多角色切分,或用 SSML 面板细化每个片段内部的节奏。

句子和段落之间的停顿

我们使用Cookie来确保您在我们的网站上获得最佳体验。了解更多：隐私政策

必要分析

接受Cookies