1回の合成を複数の音声セグメントに分割

, 27-04-2026

<cut/>タグを使って、1回の合成をダウンロード可能な複数の音声セグメントに分割します。Convertを1回押すだけで、テキストのセクションごとにきれいで個別の名前が付いたファイルが生成されます。Audacityも手作業の分割も不要です。

仕組み · SpeechGenはテキスト全体を1回で合成してタイミングとイントネーションを揃えたうえで、追加した<cut/>タグごとに音声を分割します。タグはツールバーからワンクリックで挿入するか、手で入力できます。name属性を追加するとカスタムファイル名になります。アクセント付きラテン文字、キリル文字、中国語、アラビア語など、どの文字体系でも使えます。
0:00 / 0:00
全体の流れ — 空のエディターから始めて、テキストを入力し、Cutを2回クリックして合成、最後にカスタム名を追加します。
01

空のエディターから始めます

カーソルが行頭で点滅していて、原稿を入力する準備ができています。

カーソルが点滅している空のエディター
02

テキストを入力し、分割位置にカーソルを置きます

原稿を入力します。段落でも、章でも、ポッドキャストのイントロでも、プロジェクトに必要な内容を入れてください。次に、あるセグメントが終わって次のセグメントが始まる位置にカーソルを置きます。

オーディオブック3章を入力済み。第1章と第2章の間にカーソルを配置
03

ツールバーのCutボタンをクリックします

Cutボタンはエディターのツールバーにあり、SSMLの隣にある小さなハサミのアイコンです。1回クリックすると、カーソル位置に<cut/>タグが挿入されます。次の分割位置で繰り返して、2つ目のカットを追加します。2つのカットで3つのセグメントになります。

エディターのツールバーで強調表示されたCutボタン(ホバー状態)

推奨上限: 1プロジェクトあたり短いセグメントなら1,000、長いセグメントなら500まで。

04

Convertを押すと、3つの自動命名セグメントが出力されます

SpeechGenはテキスト全体を1回の合成としてレンダリングし(これでセグメント間のタイミングとイントネーションが揃います)、続いて<cut/>タグごとに音声を分割します。各セグメントにはテキストの先頭の言葉から自動的に名前が付きます。たとえば{projectId}_1_chapter-one-the-journey-beginsのようになります。

最初のConvert後に生成された3つのセグメント

結果に新しいボタンが2つ表示されます。セグメントをダウンロード(zip)はすべてのファイルを一括取得します。山形のアイコンを押すとリストが展開され、セグメントごとにダウンロードできます。

05

カスタムファイル名にしたいときはname属性を追加します

<cut/>タグの中に直接name属性を入力します。文字、記号、ラテン以外の文字体系も使えます。アクセント付きラテン文字、キリル文字、中国語、アラビア語など、Unicode文字はそのままファイル名に保持されます。

<cut name="chapter-1"/> <cut name="chapter-2"/>

nameはそのタグで終わるセグメントに対応します。つまり1つ目のcutにname="chapter-1"を付けると、1つ目のセグメントの名前が変わります。

両方のcutタグにname属性が入力された状態
06

もう一度Convertを押します — セグメントに指定した名前が付きます

Convertを押します。同じテキストが再合成されます(変更がなければキャッシュから取得されます)。そして再び分割されます。今回は名前付きカットによって自動生成名ではなくchapter-1.mp3chapter-2.mp3が出力されます。

Convert to Speechボタンが強調表示されている状態

ファイル名だけ変更して同じテキストを再合成した場合、SpeechGenは音声に変更がないことを認識し、追加の利用枠は消費しません。

07

セグメントを一括または1つずつダウンロード

結果パネルにはダウンロードの選択肢が2つあります。① セグメントをダウンロード(zip)はすべてのファイルを一括取得します。バッチ作業に最適です。② 山形のアイコンを押すとセグメント一覧が展開され、各行に個別のダウンロードボタンが表示されます。

結果パネルでセグメントダウンロードボタンと山形ボタンが強調表示されている
08

各セグメントには指定した名前が付きます

リストには各セグメントの再生時間とダウンロードボタンが表示されます。カスタム名のセグメント、たとえば強調表示されたchapter-1chapter-2の行は、入力したとおりの名前のままです。自動命名のセグメントは、テキストの先頭の言葉から名前が取られます。

chapter-1とchapter-2の行が強調表示されたセグメント一覧

デフォルトのファイル名パターンは{projectId}_{position}_{transliterated-text}です。name="..."を指定すれば、ファイル名は入力したとおりになります。

結果

出力された合成音声を聞いてみてください。1回のレンダリングで生成されたオーディオブック3章が、別々のファイルに分割されています。

3つの章 · Aoede

3セグメント · 約9秒
このサンプルをエディターで開く

カスタムファイル名の詳細

cutタグのname属性は、そのセグメントの出力ファイル名になります。タグは名前を付けたいセグメントの末尾に置く必要があります。

…<cut name="part1"/> …<cut name="Gilderbloom_cite"/> …<cut name="Oscar Wilde"/> …<cut name="rozdział-2"/>

スペース、ハイフン、アンダースコア、Unicodeのあらゆる文字が使えます。nameを追加しない場合、SpeechGenがセグメント先頭の言葉から自動的に名前を生成します。

ファイル名だけを変更して同じテキストを再合成した場合、システムは既存の音声を再利用し、追加の利用枠は消費しません。大量のセグメントの命名を試行錯誤するときに便利です。

セグメントの上限

1つのナレーションプロジェクトあたり、短いセグメントは最大1,000長いセグメントは最大500まで対応します。出力に空のセグメントが現れたら上限に達した合図です。テキストを2つのプロジェクトに分けて回避してください。

使いどころ

これまでAudacityやDAWで手作業で音声を分割していたあらゆる場面で活躍します。代表的な例を挙げます。

教育

  • オーディオブックの章、段落単位のブロック
  • トピックやサブトピックで分割した音声レッスン
  • 外国語学習モジュール(語彙、ダイアログ、演習)
  • 問題ごとに分割した音声クイズ
  • 講義、セミナー、遠隔学習用のブロック

メディア・エンターテインメント

  • ポッドキャストのイントロ、セクション、スポンサー読み上げ、アウトロ — それぞれをきれいなファイルとして
  • Googleスプレッドシートから一括で読み上げる映画の引用
  • ラジオドラマ、舞台、インディーゲーム向けのシーンごとの音声
  • 1回のレンダリングから複数の長さで作るトレーラーのナレーション

観光・旅行

  • 観光ルート用の音声ガイド(名所ごとに1ファイル)
  • 機内安全アナウンス(セグメント単位)
  • ホテルのサービス別ウェルカムメッセージ
  • 国立公園のトレイル解説

ビジネス・ヘルスケア

  • 従業員オンボーディングモジュール
  • 製品やサービスの解説ファイル
  • カスタマーレビューや推薦コメントのリール(1引用ごとに1ファイル)
  • フェーズごとに分割したガイド付き呼吸法・瞑想セッション
  • 動作ごとに分けた患者リハビリテーションのエクササイズ音声

大量のセグメントにまとめて名前を付ける必要があるときは、Googleスプレッドシートのテンプレートと組み合わせて使ってください。

SpeechGen.ioで作成 · これで1回の合成を複数のきれいなファイルに分割する方法を習得しました。複数の話者で分けたいときはdialogタグと、セグメント内で細かいテンポを調整したいときはSSMLパネルと組み合わせて使えます。

当ウェブサイトでは、最高の体験を提供するためにクッキーを使用しています。詳細については、プライバシーポリシーをご覧ください。

クッキーを許可