小说初稿与文学手稿
把自己的稿子听一遍 — 这是发现笨拙句式与生硬对白最快的方法。叙述声线在 200 多页之内保持稳定,第十二章不会突然走样。
打开上方编辑器,点击工具栏的 文件 按钮上传您的 Word 文档(.docx、.doc、.rtf、.txt),几秒钟即可获得自然流畅的 MP3 — 小说初稿、商业报告、学习笔记皆可。SpeechGen 用 HD 神经声音将任何 Word 文件以 146 种语言 朗读出来,音色与微软自带的“朗读”功能完全不同。无需安装软件,前 3,000 字符无需登录。
浏览器内完成,无需安装 Microsoft Office。Word、Google Docs、LibreOffice、Pages 创建的文档都能处理。
在上方编辑器工具栏点击 文件 按钮,选择 .docx、.doc、.rtf 或 .txt 文件即可。修订记录与批注会自动剔除。
从 146 种语言、5,000+ 声音中挑选。可调节语速与音调,也可在生成前对两条声音做并排试听。
短文档几秒生成,整本书也只需几分钟。MP3 落入账户后,可一次下载或随时在线收听。
四类我们每天都看到的真实场景。点击卡片即可试听 — 同一套引擎,您的文件可直接接入上方编辑器。
把自己的稿子听一遍 — 这是发现笨拙句式与生硬对白最快的方法。叙述声线在 200 多页之内保持稳定,第十二章不会突然走样。
季度回顾、市场调研、董事会备忘录、法律合同 — 把 40 页 Word 文档压成 25 分钟的 MP3,在通勤路上听完。语调干练,商务节奏自然。
把课堂笔记、课程讲义和复习提纲转成可在散步时复习的音频。语速适中可控,临考前可调到 1.4× 快速过一遍而不失真。
两种语言混排的 Word 文档 — 拖入文件,中文段落用中文声音,英文段落用英文声音。靠耳朵校对译稿,听到母语者实际听到的样子。
面向小说与剧本的进阶工具:
使用 <cut> 标签 一次合成将整部书稿切分成各章独立的 MP3,
使用 <dialog> 标签 给每位角色分配不同声音的对话朗读,
并用 <break> 标签 在场景之间留出精准的戏剧停顿。每个标签都附有简明指南。
Microsoft Word 内置的“朗读”功能,在 Word 里做校对完全够用 — 但有三件事是它做不到的。
Word 的“朗读”只能在应用内播放,关闭文件就停止。SpeechGen 导出的是一份可以保留的 MP3 — 拷到手机上、在飞机上离线听、通过 Slack 分享、加进播客订阅源都行。也支持输出 WAV 或 OGG。
标题层级(一级/二级/三级)会获得短暂停顿和轻微音调变化,听上去就能分辨结构。项目符号列表会作为独立条目朗读。修订记录、内嵌批注与书签会自动剔除 — 朗读的只是清洁的最终稿。
Chromebook、Linux、iPad、Android — 只要有浏览器就能用。同一流程也可处理 Google Docs、LibreOffice、Pages、Apple Notes 导出的 .docx。要听一份 Word 文档,本地不必装 Word。
在本页顶部的编辑器工具栏点击 文件 按钮,选择 .docx(或 .doc、.rtf、.txt),挑选声音和语种后点击转换。短文档约 30 秒落入账户,整本书需 2–5 分钟。本机无需安装 Word。
不会 — 两者都会自动剔除。朗读的只是按打印效果呈现的最终干净文本。如果需要批注内容也读出来,请先在 Word 里接受或拒绝所有修订、解决并删除批注,然后重新导出再上传。
可以。在 Google Docs 中选择 文件 → 下载 → Microsoft Word (.docx),然后把文件上传到本页面即可。Google 自带的朗读功能只能在浏览器标签页内播放,而 SpeechGen 给您的是一份可携带的 MP3,可离线收听或转发分享。
标题层级(一级/二级/三级)会获得短暂停顿和轻微音调变化,文档结构听得出来。项目符号与编号列表作为独立条目朗读。表格按行展开,每行之前先读一次列标题。图片会跳过,替代文本不读出。
.doc(Word 97–2003 二进制格式)、.rtf 与 .txt 直接受支持 — 上传方式相同。.odt(LibreOffice / Apple Pages 的 OpenDocument)需要先转一下:在 LibreOffice 中打开,选择 文件 → 另存为 → Word .docx,然后再上传。
可以 — 两种能力都已内置。把章节断点用 <cut> 标签包起来,一次合成即可得到每章一份独立的 MP3。对话场景使用 <dialog> 标签,可以在同一段音频里给每个角色分配不同的演员声线。两者结合就能做出真正的多人有声书。
可以 — Microsoft Word 内置的“朗读”功能,做校对完全够用。但它只能在应用内播放,无法导出 MP3,且支持的语种远远更少。SpeechGen 提供 146 种语言、HD 神经声音以及一份可以带走的下载文件。
Word 只是其中一种入口。同一个 SpeechGen 账户也可以使用以下工具。