Skip to editor

字幕配音工具 — 将 SRT 字幕转为 MP3 音频 · AI 配音在线生成

上传 .srt、.sub 或 .vtt 文件 — 获得 MP3、WAV、OGG 格式的 AI 自然语音。免费试用。

cmn-CN
Achernar CN
风格
速度:1.0
音调:0
音量:100%
文件
暂停
清除
后退一步
前进
SSML
自动同步时间戳 5,000+ AI 语音 几秒内生成 MP3、WAV、OGG

如何免费将 SRT 字幕转换为 MP3 音频

无需安装软件。上传字幕文件,检查,点击转换。

01

上传 SRT、SUB 或 VTT 文件

点击"选择文件"并上传你的字幕文件。系统会自动读取时间戳、时长与文本。支持 SRT、SUB 与 VTT 格式。也可以直接将文本粘贴到编辑器里。

02

付费前先检查字幕

点击"检查字幕"以分析文件。系统会检测时间戳重叠、缺失行、编码错误和过长的句子。先修正再转换 — 节省字符数,免得重做。

03

转换并下载 MP3、WAV 或 OGG

点击"将字幕转为语音" — AI 按照 SRT 时间戳逐行同步。从超过 5,000 个语音、146 种语言中选择。下载成品,或通过 API 批量处理。前 1,000 字符免费,无需注册。

SRT 文件如何被转换为音频

每一行字幕都变成一段语音。AI 严格遵守时间戳 — 字幕要求什么时候开口,就什么时候开口。

zimu.srt audio.mp3 Xiaoxiao PRO · zh-CN
00:00 — 00:03
1
欢迎来到《数据分析入门》课程。
0.5秒
00:03 — 00:07
2
本模块将教你如何清洗和转换原始数据。
停顿 3.0 秒
00:10 — 00:13
3
让我们从数据预处理的基础开始。

AI 字幕配音如何工作

上传 SRT、SUB 或 VTT 格式的字幕文件(英文也称为 SRT to audioSRT to MP3subtitle to voice converter)。选择语言、语音、速度与音调。点击"将字幕转为语音" — AI 把 SRT 转为音频,按照时间戳逐段朗读。

时间戳与速度

每条字幕的时间戳(例如 00:00:00,000 --> 00:00:02,500)决定朗读时机。若文本过长,语音最多加速至 。再长 — 校验器会提前警告。常见于翻译字幕或语言文字更长的情形。

格式规则

SRT 要求毫秒前用逗号分隔 — 00:00:02,500,而不是 02500。Google 翻译有时会吞掉这个符号 — 翻译后一定要检查。一个块里的换行 = 一句话。结尾加句号。若是纯文本无时间戳,请使用文字转语音主页

#
强制压缩速度指令

在字幕行开头放一个 # — SpeechGen 会强制语速以匹配时间戳,跳过 3× 的限制。合理分配加速幅度,音质更自然。

[ ]
跳过朗读指令

用方括号包裹文本 [ 像这样 ] — SpeechGen 会跳过此段但仍保留时间戳。适合删去对白又不破坏最终音频的节奏。

SRT 格式精确度

一个错位的逗号或缺失的空行,就会毁掉时间戳。时间码的结构解剖:

00:00:03 时:分:秒
, 逗号,不是点号
500 毫秒
 -->  空格 箭头 空格
00:00:07 结束时间
, 逗号
000 毫秒
  • 每条字幕以序号(1、2、3…)开始 — 必须连续递增
  • 毫秒前使用逗号,不是句点 — 00:00:03,500,不是 00:00:03.500
  • 箭头精确写作 -->,两侧各一个空格
  • 每行结尾加标点(句号、问号、感叹号)— 少了它,语音会在句中被截断
  • 字幕之间用一行空行分隔 — 缺了它,两条字幕会被合并成一条
翻译字幕后(Google 翻译、DeepL)— 请务必检查文件。翻译工具有时会删除时间戳里的逗号,吞掉空行,或添加破坏语法的空格。

试听字幕转换成的语音

真实场景下字幕被转换为语音的样例。每一个示例都由一个 SRT 文件生成 — 带时间戳、停顿,一切如实保留。

在线课程 在线课程的开场部分 — 4 条字幕与幻灯片切换同步。每一段引入一个新主题,按讲课节奏展开。 Xiaoxiao PRO · zh-CN · 4 行 · 15 秒 在 SpeechGen 查看
软件本地化 产品引导视频被配音成中文 — 4 条字幕与原视频的镜头切换精确对齐。 Yunxi PRO · zh-CN · 4 行 · 14 秒 在 SpeechGen 查看
安全培训 工业作业安全须知 — 工厂员工入职视频的 4 条字幕被自动配音。 Yunjian PRO · zh-CN · 4 行 · 16 秒 在 SpeechGen 查看
产品宣传片 产品发布宣传短片,时间戳精准 — 4 条字幕,每行对应视频的一个视觉重点。 Xiaoyi PRO · zh-CN · 4 行 · 11 秒 在 SpeechGen 查看

AI 配音 — 5,000+ 语音在线生成字幕音频

上传字幕,挑一个语音,获取同步好的音频。视频的自动配音 — 不用手动对齐时间,不用做任何剪辑。

5,000+ AI 语音 · 146 种语言

标准、HD 与 PRO 多种音质,146 种语言的自然语调。一个 SRT 文件 → 可配音为多种语言版本。每种语音都会自动与你的时间戳对齐。

自动时间戳同步

AI 读取 SRT 时间戳,并调整语速以对齐每一段 — 最多加速 3×。若文本放不下,校验器会在转换前提前警告。

多语音对白模式

为不同角色分配不同语音 — 每条字幕可独立使用一个语音。通过"添加语音"按钮增设角色。每种语音甚至可以使用不同的语言。

Smart Cache 与积分

每一句话都会被缓存。改动时间戳而不改动文本 — 不收费。只修改一行 — 仅对那一行扣费。SRT 标记(时间戳、序号)永远不计入字符额度。

为旁白添加背景音乐

在同一个转换器里,即可将 AI 无版权音乐与配音混合。可从 133 个音乐分类中选择背景音乐。调整音量,对长视频开启循环。 最终文件只需下载一次:语音与音乐已完美混音。

在编辑器下方的"设置"中打开背景音乐面板。 上传你自己的音轨或从音乐库选择。设置音量与循环 — 完成。

133 个音乐分类 · 无版权 · AI 生成

SRT 转 MP3 — 从字幕下载音频

选择输出格式。从适合网络传输的压缩 MP3,到可供 Premiere、DaVinci 或任意 DAW 后期使用的无损 WAV。采样率可选 8 kHz 到 48 kHz。

MP3
压缩
WAV
无损
OGG
开放格式
OPUS
低码率
FLAC
归档

免费在线配音软件 — 无需下载注册,支持中文与 146 种语言

从 YouTube 视频到在线课程 — 将字幕文件转为自然配音,任意语言可选。繁体中文字幕转语音亦支援(字幕轉語音)。

有字幕?获取音频。

你已经有 SRT 文件 — 来自 YouTube 自动字幕、视频剪辑工具或转录服务。上传、选语音、下载 MP3。时间戳已在文件里 — 我们只是补上语音。

把视频配音成另一种语言

翻译 SRT,上传译后的版本。AI 会用 146 种语言之一生成自然语音,与原时间戳同步。一个源视频 → 多语言版本。中文、英文、日语、韩语和其余 142 种语言一应俱全。

无需录音棚

不用麦克风,不用配音演员,不用重录。从你的字幕脚本生成旁白。改一行 → 只重做那一行。修改只要几秒,而非几天。

扩展视频生产规模

从字幕文件批量生产数百个视频的音频。提供 API 做批处理。Smart Cache 只重新生成已改动的部分。按字符付费 — 没有月费。

SRT 转音频还是音频转 SRT?我们将字幕转换为语音,而不是反过来。

字幕 音频 TTS · 配音 AI
音频 字幕 转录 · ASR

SpeechGen 接收你的字幕文件(SRT、VTT、SUB),以同步的 AI 语音输出为音频。若你需要反向流程(从音频中提取文字),请使用我们的音频转文字工具

常见问题

SRT 文件转换

如何免费把 SRT 文件转成语音?

上传 SRT 文件,选择一个语音,点击"将字幕转为语音"。前 1,000 字符免费 — 无需注册,无需信用卡。注册后可在 7 天内每天额外获得 3,000 个免费字符。

能在线将 SRT 转为 MP3 吗?

完全可以 — 转换前将输出格式选为 MP3 即可。同时也支持 WAV、OGG、OPUS 与 FLAC。采样率从 8 kHz(电话音质)到 48 kHz(录音棚音质)可选。文件在转换完成后立即下载。

支持哪些字幕格式?

SRT、SUB 与 VTT。系统会自动读取时间戳、序号与文本。SRT 标记(时间戳、序号)永远不会计入你的字符额度。

可以用 AI 语音为字幕配音吗?

可以 — 语音库中的全部语音都支持 SRT。标准、HD 与 PRO 音质,共 146 种语言。每种语音都会自动按 SRT 时间戳同步,必要时最多加速 3×。使用多语音对白模式可为每一行字幕分配不同角色。

支持繁体中文字幕(字幕轉語音)吗?

支持。简体与繁体中文均可处理 — 上传 Traditional Chinese 的 SRT 文件,SpeechGen 会按原文朗读。台湾、香港、澳门的用户可直接使用 字幕轉語音SRT 轉 MP3配音軟體 等需求。如需纯文字转语音(无时间戳),请使用中文文字转语音主页

SpeechGen 是音频转字幕还是字幕转音频?

只做字幕转音频。本页接收 SRT、SUB 或 VTT 文件,输出同步的 AI 语音。我们不从音频中提取文字 — 那是自动语音识别(ASR),属于另一种服务。这里只做:SRT → MP3、WAV、OGG。

AI 配音与功能

有免费的 AI 配音软件吗?

SpeechGen 提供 1,000 个字符免费额度,无需注册 — 足以尝试一个短 SRT。注册后可在 7 天内每天获得 3,000 个免费字符。之后按使用量付费 — 没有月度订阅,没有承诺。

什么是 AI 配音,它如何处理字幕?

AI 配音即把字幕自动转为同步语音的过程。系统读取 SRT 文件里的时间戳,为每一段生成与之匹配的朗读。可用一种语音覆盖全文,也可在对白模式下给不同行分配不同语音。非常适合把视频本地化到多种语言而无需雇佣配音演员。

有免费的在线自动配音工具吗?

有。前 1,000 个字符的配音免费,无需注册。拥有免费账号后,在 7 天内每天可获得 3,000 字符。更大体量的项目按使用量付费 — 每个积分从 4.99 美元起,没有月费。

SpeechGen 可以在线朗读 SRT 文件吗?

可以。把 SRT 文件上传到页顶的转换器里,然后点击"检查字幕"查看内容、时间戳以及任何潜在问题。随后你可以把它转成音频,或仅用预览功能听一下。

如何用 AI 从音频生成字幕?

本页的方向相反:字幕 → 音频。若你需要从音频生成字幕(转录/ASR),请使用我们的音频转文字工具。这里只把 SRT 文件转换为同步朗读,而不反向操作。

有没有用于 SRT 转音频的 API?

有。SpeechGen 的 REST API 支持字幕文件转换,参数与网页一致 — 可选语音、格式、速度、多语音对白等。查看 API 文档,了解 endpoint、参数与示例代码。

把你的字幕转成音频 — 免费试用

SRT 转换器就在本页顶部。上传文件、选择语音、点击转换即可。

支持 SRT、SUB、VTT 含商用授权

已生成 7 亿个文件。100 万用户。按使用量付费 — 没有月费。

Upload Subtitles

我们使用Cookie来确保您在我们的网站上获得最佳体验。了解更多:隐私政策

接受Cookies