1回の合成を複数の音声セグメントに分割
15-09-2025 , 27-04-2026
<cut/>タグを使って、1回の合成をダウンロード可能な複数の音声セグメントに分割します。Convertを1回押すだけで、テキストのセクションごとにきれいで個別の名前が付いたファイルが生成されます。Audacityも手作業の分割も不要です。
<cut/>タグごとに音声を分割します。タグはツールバーからワンクリックで挿入するか、手で入力できます。name属性を追加するとカスタムファイル名になります。アクセント付きラテン文字、キリル文字、中国語、アラビア語など、どの文字体系でも使えます。
空のエディターから始めます
カーソルが行頭で点滅していて、原稿を入力する準備ができています。
テキストを入力し、分割位置にカーソルを置きます
原稿を入力します。段落でも、章でも、ポッドキャストのイントロでも、プロジェクトに必要な内容を入れてください。次に、あるセグメントが終わって次のセグメントが始まる位置にカーソルを置きます。
ツールバーのCutボタンをクリックします
Cutボタンはエディターのツールバーにあり、SSMLの隣にある小さなハサミのアイコンです。1回クリックすると、カーソル位置に<cut/>タグが挿入されます。次の分割位置で繰り返して、2つ目のカットを追加します。2つのカットで3つのセグメントになります。
推奨上限: 1プロジェクトあたり短いセグメントなら1,000、長いセグメントなら500まで。
Convertを押すと、3つの自動命名セグメントが出力されます
SpeechGenはテキスト全体を1回の合成としてレンダリングし(これでセグメント間のタイミングとイントネーションが揃います)、続いて<cut/>タグごとに音声を分割します。各セグメントにはテキストの先頭の言葉から自動的に名前が付きます。たとえば{projectId}_1_chapter-one-the-journey-beginsのようになります。
結果に新しいボタンが2つ表示されます。セグメントをダウンロード(zip)はすべてのファイルを一括取得します。山形のアイコンを押すとリストが展開され、セグメントごとにダウンロードできます。
カスタムファイル名にしたいときはname属性を追加します
<cut/>タグの中に直接name属性を入力します。文字、記号、ラテン以外の文字体系も使えます。アクセント付きラテン文字、キリル文字、中国語、アラビア語など、Unicode文字はそのままファイル名に保持されます。
nameはそのタグで終わるセグメントに対応します。つまり1つ目のcutにname="chapter-1"を付けると、1つ目のセグメントの名前が変わります。
もう一度Convertを押します — セグメントに指定した名前が付きます
Convertを押します。同じテキストが再合成されます(変更がなければキャッシュから取得されます)。そして再び分割されます。今回は名前付きカットによって自動生成名ではなくchapter-1.mp3とchapter-2.mp3が出力されます。
ファイル名だけ変更して同じテキストを再合成した場合、SpeechGenは音声に変更がないことを認識し、追加の利用枠は消費しません。
セグメントを一括または1つずつダウンロード
結果パネルにはダウンロードの選択肢が2つあります。① セグメントをダウンロード(zip)はすべてのファイルを一括取得します。バッチ作業に最適です。② 山形のアイコンを押すとセグメント一覧が展開され、各行に個別のダウンロードボタンが表示されます。
各セグメントには指定した名前が付きます
リストには各セグメントの再生時間とダウンロードボタンが表示されます。カスタム名のセグメント、たとえば強調表示されたchapter-1とchapter-2の行は、入力したとおりの名前のままです。自動命名のセグメントは、テキストの先頭の言葉から名前が取られます。
デフォルトのファイル名パターンは{projectId}_{position}_{transliterated-text}です。name="..."を指定すれば、ファイル名は入力したとおりになります。
カスタムファイル名の詳細
cutタグのname属性は、そのセグメントの出力ファイル名になります。タグは名前を付けたいセグメントの末尾に置く必要があります。
スペース、ハイフン、アンダースコア、Unicodeのあらゆる文字が使えます。nameを追加しない場合、SpeechGenがセグメント先頭の言葉から自動的に名前を生成します。
ファイル名だけを変更して同じテキストを再合成した場合、システムは既存の音声を再利用し、追加の利用枠は消費しません。大量のセグメントの命名を試行錯誤するときに便利です。
セグメントの上限
1つのナレーションプロジェクトあたり、短いセグメントは最大1,000、長いセグメントは最大500まで対応します。出力に空のセグメントが現れたら上限に達した合図です。テキストを2つのプロジェクトに分けて回避してください。
使いどころ
これまでAudacityやDAWで手作業で音声を分割していたあらゆる場面で活躍します。代表的な例を挙げます。
教育
- オーディオブックの章、段落単位のブロック
- トピックやサブトピックで分割した音声レッスン
- 外国語学習モジュール(語彙、ダイアログ、演習)
- 問題ごとに分割した音声クイズ
- 講義、セミナー、遠隔学習用のブロック
メディア・エンターテインメント
- ポッドキャストのイントロ、セクション、スポンサー読み上げ、アウトロ — それぞれをきれいなファイルとして
- Googleスプレッドシートから一括で読み上げる映画の引用
- ラジオドラマ、舞台、インディーゲーム向けのシーンごとの音声
- 1回のレンダリングから複数の長さで作るトレーラーのナレーション
観光・旅行
- 観光ルート用の音声ガイド(名所ごとに1ファイル)
- 機内安全アナウンス(セグメント単位)
- ホテルのサービス別ウェルカムメッセージ
- 国立公園のトレイル解説
ビジネス・ヘルスケア
- 従業員オンボーディングモジュール
- 製品やサービスの解説ファイル
- カスタマーレビューや推薦コメントのリール(1引用ごとに1ファイル)
- フェーズごとに分割したガイド付き呼吸法・瞑想セッション
- 動作ごとに分けた患者リハビリテーションのエクササイズ音声
大量のセグメントにまとめて名前を付ける必要があるときは、Googleスプレッドシートのテンプレートと組み合わせて使ってください。