字幕をAIで音声化し、任意の言語でテキストを音声に変換して、ビデオをダビングします。字幕ファイルをアップロードし、SpeechGenがそれらをすべてのタイムコードを考慮に入れて音声に変換します。
AIによる字幕音声化の仕組み
SRT、SUB、VTT形式の字幕ファイルをアップロードし、言語と必要な音声、話速、音高を選択します。 "字幕を音声化する" ボタンをクリックすると、SpeechGenが先進的なAIアルゴリズムを使用して自動的に字幕を音声化します。
知っておくべき重要なこと
動作原理。AIは字幕のフォーマットを読み込み、タイミングに基づいてオーディオセクションの長さを決定します。例としてこの部分を見てみましょう。
00:00:00,000 --> 00:00:02,500。これは、0秒から2秒500ミリ秒間で指定されたテキストを音声化する必要があることを示しています。
もしSpeechGenが通常の速度でこの期間に音声化を完了できないと判断した場合、指定された時間内に終わるように話速を速めます。ただし、発音の良さのために、システムには最大スピードの制限があります。音声化の間隔を3倍超えるスピードで予定している場合、バリデーターが警告を表示します。
これは、字幕が正確でないためや、言語ごとの単語の長さの違いにより発生します。問題のある部分を手動で修正することも、SpeechGenに任意のスピードで音声化させることも可能です。
速度制限を無視する指示。行の先頭にハッシュマーク#を設定すると、SpeechGenは強制的にこのテキストを任意の速度で音声化し、何をおいてもタイミングを守ります。ただし、ダビングの品質向上のために、前と現在のサブブロックの時間間隔を修正し、スピードアップを均等に分散させることを推奨します。
不要なテキストを角括弧で音声化から除外します。リプライの一部を省略したい場合でも、ペースを落とさずに、全体のテキストブロックをこれのように選択します:[ ]。SpeechGenは角括弧内に指定されたすべてを無視しますが、タイミングは維持されます。
フォーマットを守ります。それぞれのファイルタイプごとに、それ以外の場合、私たちのシステムは正しくスピーチを合成できません。たとえば、srtでミリ秒の前にコンマを省略すると00:00:02500、SpeechGenはこれを読むべき数値だと考えます。コンマが抜ける場合は、Google Translateを介してsabの翻訳を行っている場合などです。
このページでは、SpeechGenはstr、vtt、sub形式にリンクされています。通常のテキストを使用する場合は、標準ページをオンライン音声化で使用してください。
テキストの改行は同じタイミングブロック内で1つの文章として音声化されます。システムが文章が終わったことを理解するために、適切な場所にピリオドを設定してください。
マルチボイス音声化は利用可能ですか?
はい、 異なる音声で音声化する ことが可能です。ただし、タイミング内の一つの行は1つの音声のみが音声化できます。"音声を追加"ボタンを使って必要な音声を選択し、一つのsabブロック内の各リプライ全体を囲むようにします。間違った操作を行った場合、システムが警告を表示します。
任意の言語で追加の音声を選択できます。ただし、字幕内にその言語のテキストとアルファベットがあることを確認してください。
SRT、SUB、VTTの技術情報に対する制限(クレジット)は引き落とされますか?
いいえ、システムは技術情報が指定されている場所を理解し、これを 制限の引き落とし には考慮していません。ただし、音声化フィールドの下には "文字数"という小さな計算機が表示され、すべての文字を基本的にカウントします。心配しないでください、システムはこの情報に依存せず、より複雑なアルゴリズムを使用します。プロフィールでの実際の制限の引き落としを確認することでこれを確認することができます。
経済的なキャッシングはありますか?
はい、ビデオの伴奏音声の作成時、SpeechGenは各文をキャッシュします。再音声化時、システムは変更された文のみに制限を適用します。
字幕のタイミングを変更してください - 同じテキストの再音声化は無料です。システムは音声化を自前のアルゴリズムによって高速化します。新しいインターバルに納まるようにする必要がある場合、SpeechGenは音声化をやり直さずにスピードをブーストするだけです。だから、余分な出費を恐れずにsabの間隔を編集してください。
AIによる伴奏ダビングの利点
- インターネットからの任意のビデオの自然でスムーズなダビングの作成に、AIダビングを利用します。お気に入りのドラマの次のエピソードがスタジオで音声化されるのを待つ必要はありません。字幕をダウンロードし、SpeechGenで音声化します。
- 字幕を音声に非常に速く変換できます。mp3またはWAVの音声ファイルが使用可能であり、すぐに使用できます。音声ファイルを結合し、それをビデオと結合して、ダブル音声のクリップを視聴します。
- ビデオのAI音声化により、外国語のコンテンツの利用可能性が向上します。
- 視聴者を拡大するために、ビデオの多言語音声化を作成します。人気のある言語でコンテンツを放送します。
これは誰に適していますか?
我々のサービスはコンテンツクリエイター、教育機関、マーケティングチーム、そして彼らのビデオをよりアクセス可能で対話型のものにしたい全ての人に最適です。AIによる字幕音声化は、視聴者を拡大し、コンテンツとのインタラクションを向上させる新しい可能性を開きます。
使用例
- 国際的な視聴者向けの教育ビデオに伴奏音声をつけます。
- 複数の言語に翻訳されたマーケティングと広告の映像。
- 字幕を音声に変換することで、聴覚障害者にビデオコンテンツを利用可能にします。
- YouTubeチャンネルやソーシャルネットワークのマルチリンガルコンテンツを作成します。
今日からSpeechGenを使い始めましょう
私たちのサービスの利便性と効果を既に評価している何千人もの満足したユーザーに参加しましょう。AIで字幕を音声化し、今すぐあなたのコンテンツを広範な視聴者に利用可能にしてください!