上传音频或视频
拖放 MP3、WAV、MP4 文件 — 或粘贴 YouTube 链接。文件最大 1 GB、时长 3 小时。
一次上传完成语音转文字与 SRT/VTT 字幕生成 — 带说话人标签和时间戳,可直接导入任何视频编辑软件。
上传文件,让 AI 处理,然后按工作流调整导出格式。
拖放 MP3、WAV、MP4 文件 — 或粘贴 YouTube 链接。文件最大 1 GB、时长 3 小时。
我们的模型以 95–98% 的准确率将语音转文字,为每行添加时间戳并标记说话人。
调整段落节奏和时间戳显示方式,然后导出为 TXT(给文字工作者)、DOCX(用于审阅)或 SRT/VTT 字幕(适配任何视频播放器)。
如果您要转录的是机密访谈、医疗对话、法务录音或内部会议,以下是我们处理文件的具体方式。没有营销辞藻。
您上传的每个音频文件都通过加密通道传输,取回转录文本时同样如此。SSL/TLS 端到端加密。
上传后 3 天,您的音频文件及其转录文本会从我们的存储中彻底清除。需要保留副本?请在此期限内下载或设置提醒。
您的录音始终归您所有。它们不会进入任何训练流程。负责转录的模型已预先训练并冻结 — 您的文件只处理一次,然后被遗忘。
欧盟用户享有标准权利 — 复制、删除、可携带性 — 可通过账户或客服行使。每次上传都位于一个仅限创建账户访问的私有 URL。
您的内容始终保持私密、加密,完全由您掌控。
输入支持音频、视频和 YouTube 链接 — 输出涵盖所有常见的转录文本格式。
MP3WAVOGGOPUSAACM4AFLACAMRAIFF3GPWEBM
MP4MOVMKVWMVAVIWEBM
YouTubeYouTube Shorts
TXTDOCXPDFSRTVTTCSV剪贴板
上传音频 — 获取干净的转录文本和已按字幕友好行长切分好的字幕文件。下方 38 秒样本可转换为 SRT 与 VTT(高亮显示),也支持 TXT、DOCX、PDF 和 CSV。您的文件输出格式完全相同。
说话人 1 · 00:01
您是怎么开始做科技新闻的?
说话人 2 · 00:05
老实说,是偶然。当时我在跑市政厅口…
科技新闻访谈
转录样本 · 0:38
说话人 1 · 00:01
您是怎么开始做科技新闻的?
实质上就是内置的字幕生成器:SRT 与 VTT 文件已按字幕友好行长(每行 ≤ 42 字符)预先切分 — 可直接导入 Premiere、DaVinci、Final Cut、CapCut 或 YouTube Studio。也可先调整所有输出参数。
大多数语音转文字工具只输出一大段文本。我们的工具按说话人、按停顿长度、按段落节奏切分转录文本 — 可针对下游工具进行调优。
自动检测,或将每段固定为 1、2、3、4 或 8 行。当您要粘贴到有自己节奏要求的文档时很有用。
自动1 行2 行3 行4 行8 行AI 会在停顿后开始新段落。按您的偏好调整停顿长度 — 语速快的内容用短停顿,娓娓道来的独白用长停顿。
500 ms700 ms(默认)1500 ms自定义按段显示便于快速浏览,按句显示用于法务引用,两者都开启则提供完整审计线索,关闭则得到干净的可发布文本。
按段按句两者关闭自动标记为 说话人 1 / 说话人 2。在编辑器中重命名,以匹配您上传内容里的嘉宾、主持人或访谈对象。
说话人姓名按说话人合并隐藏一键将转录文本压缩为可发布的纯文本 — 直接交给文字工作者、LLM 摘要工具,或粘贴到 CMS 草稿里。
纯文本模式跳过文件步骤。把配置好的转录文本直接粘贴到 Notion、Google Docs 或您的 CMS — 已经是您要的格式。
复制到剪贴板以下是我们的模型能稳定输出高质量结果的语言。自动检测会选择正确的语言;混合语言片段也能处理。
如果您的音频是较少见的语言,请先在免费额度上跑一段 60 秒的样本试试。
一个转录引擎,覆盖所有需要从声音中提取文字的工作流。
将访谈和现场录音转为文字 — 输出带说话人标签,转文字工具专为快速摘录引语而设计。
把课程和研讨会变成学习笔记。加上时间戳后快速浏览,无需重听音频。
一款音频转文字工具,同时充当节目笔记生成器:导入 MP3,得到博客复用素材、节目摘要和章节提示。
使用内置的字幕生成器,为 YouTube、TikTok 及任意视频播放器生成 SRT 与 VTT 字幕文件。
将证词、听证会和会议录音转为文字,带时间戳便于按行引用复核。
上传会议录音,获得带行动事项的转录文本,直接粘贴到您的协作文档中。
用您自己的音频测试转录质量。无需信用卡。需要更多分钟数时再充值。
新用户最常问的问题 — 直接给出答案。