動画ファイルをテキストに文字起こし

ここにファイルをドラッグ＆ドロップするか、クリックして選択
mp3, wav, ogg, opus, aac, m4a, flac, amr, aiff, aif, 3gp, webm, mp4, mov, mkv, wmv, avi

+さらに追加

言語を選択

モデル選択

	ファイル名	日付	時間	状態

履歴

MP4、MOV、AVI(最大1 GB)をドロップするだけ — 動画文字起こしで話者ラベル付きテキストと、Premiere、DaVinci、Final Cut向けのフレーム同期SRTを生成します。

AI精度95〜98% 最大1 GB / 3時間 3日後に自動削除・学習に使用しない無料10分・登録不要・カード不要

動画をテキストに文字起こしする手順 — 3ステップ

動画ファイルをアップロードし、AIが音声トラックを処理、最後にエクスポート設定を整えるだけ。

動画ファイルをアップロード

MP4、MOV、MKV、WMV、AVI、WEBMをドラッグ&ドロップ — 最大1 GB、3時間まで。音声は自動で抽出されます。

AIが文字起こし

モデルが精度95〜98%でテキスト化し、各行にタイムスタンプを付け、話者ラベルを割り当てます。

設定してエクスポート

編集レビュー用の段落長と、タイムライン用のフレーム同期フレーズタイムスタンプを設定。SRTをPremiereやDaVinciにドロップ、または翻訳者にDOCXを渡せます。

プライバシーとデータの取り扱い — 包み隠さず

動画ファイルには機密インタビュー、証言録取、医療セッション、社内収録が含まれることがあります。アップロードをどう扱っているか、明確にお伝えします。

通信は暗号化

1 GBのMP4アップロードも、銀行が決済に使うのと同じTLSトンネルを通ります。音声抽出からテキスト取得まですべてHTTPS、平文は経路のどこにも残りません。

3日後に自動削除

MP4と生成されたテキストは、アップロードから3日後に削除予約されます。プロジェクトページでDeleteを押せば、次回のスイープで両方とも消去されます。

学習データには使用しません

あなたの動画素材はモデル学習には使われません。音声を抽出して文字起こしし、破棄するだけ — 映像の保管も、学習セットへの取り込みも、行動特徴の収集も行いません。

GDPR準拠

EUのクライアントは、各アップロードに対して完全なデータ権利を保持します。各動画文字起こしは推測不能なURLに保管され、プロジェクト所有アカウントからのみアクセス可能です。

あなたの動画コンテンツは非公開・暗号化され、完全にあなたの管理下に置かれます。

動画をドロップ、編集タイムライン用SRTを取得

音声が抽出され、文字起こしされ、字幕に適した行長で分割されます — 動画編集ソフトはそのSRTをそのまま読み込めます。

動画ファイルをドロップ

主要なコンテナに対応 — MP4、MOV、MKV、WMV、AVI、WEBM、QT。1ファイルあたり最大1 GB、3時間まで。解像度は問いません — 読み取るのは音声トラックだけです。

音声トラックを抽出して文字起こし

映像は再エンコードせず、音声のみを取り出してモデルに通します。精度95〜98%、最大8名の話者にラベル付け、元クリップのタイムラインに揃ったタイムスタンプを生成します。

編集ソフトの字幕トラックにSRTをドロップ

行は字幕に適した長さに事前分割済み(42文字以下)。フレーム同期のタイムスタンプはHH:MM:SS,ms SRTまたはHH:MM:SS.ms VTTで出力 — どちらも編集のフレームレートに合わせて丸められ、ズレが出ません。

動作確認済み

Adobe Premiere Pro
DaVinci Resolve
Final Cut Pro
CapCut & CapCut Pro
Avid Media Composer
Camtasia、ScreenFlow
YouTube Studio(再アップロード)
Subtitle Edit、Aegisub

フレームレート対応 — 24、25、29.97、30 fpsのタイムラインで、タイムスタンプのズレなく動作します。

対応する動画フォーマット

主要な動画コンテナはすべて対応 — 出力する文字起こしの主要フォーマットも一通り揃っています。

入力動画

MP4MOVMKVWMVAVIWEBMQT

制限

最大1 GB最大3時間解像度自由

出力テキスト

TXTDOCXPDFSRTVTTCSVクリップボード

動画文字起こしを用途に合わせて設定

多くの動画文字起こしツールは、テキストを一塊で吐き出すだけです。SpeechGenはあらゆるNLEで使えるフレーム同期SRT/VTTと、編集レビュー向けに段落長を整えたDOCXを出力します。

タイムスタンプ

タイムラインにフレーム同期

動画における最大のメリット。段落タイムスタンプは編集のカット候補に、フレーズ単位のタイムスタンプは映像にフレーム同期し、行ごとのコンフォーミングに使えます。スクリプト作成時は両方、翻訳者への引き継ぎ時はオフをどうぞ。

段落 → カット候補フレーズ → フレーム同期両方オフ

話者

ショットごと、シーンごとにラベル付け

ドキュメンタリーのインタビューやパネル収録に不可欠。声で自動ラベル付けされた後、エディタでショットごとに改名できます — 監督、被写体A、被写体B といった具合に。1人の話者がテイクの大半を占める場合は連続したターンを統合できます。

話者名話者ごとに統合非表示

段落の長さ

編集レビューに最適化

自動判定、もしくは各段落を1、2、3、4、8行に固定。字幕の下書きには引き締まったリズムを、編集レビューや翻訳者への引き継ぎなら長めの段落をどうぞ。

自動1行2行3行4行8行

プレーンテキスト

翻訳者やスクリプト向けの素のテキスト

1つのスイッチでタイムスタンプ、ラベル、書式をすべて削除。結果は翻訳メモリツール(Trados、MemoQ)、脚本家のドラフト、AI要約にすっきり収まります。

プレーンテキスト

残り2つのコントロール — 無音区切りとワンクリックでクリップボードへコピー — でパネルは完成です。ハブで6種すべて見る。

動画ソース全般で対応する言語

これらの言語は、ドキュメンタリー、インタビュー、カンファレンス、現場収録の動画で安定して結果を返します。自動判定で正しい言語が選ばれ、多言語混在のカットにも対応します。

英語
スペイン語
中国語(普通話)
ポルトガル語
ドイツ語
フランス語
イタリア語
ロシア語
日本語
韓国語
ヒンディー語
アラビア語

現場収録の多言語インタビューは、本素材を投入する前に無料枠で短いクリップを試してください。

動画ファイル文字起こしのユースケース

アップロードしたMP4が1本あれば — 画面上の言葉を必要とする下流のワークフローすべてに行き渡ります。

会議・カンファレンス

ZoomやTeamsの収録をドロップすれば、話者ラベル付きの検索可能な文字起こしが得られます — アクションアイテムや議事録に最適です。

教育コンテンツと講義

収録した講義、セミナー、オンデマンド講座を学習ノートに変換 — タイムスタンプ付きで参照しやすくなります。

メディア・コンテンツ制作

インタビューやドキュメンタリーから、本編のセリフとB-rollのナレーションを取り出す動画文字起こし — MP4から編集タイムライン上のテキストへ直結します。

法務・コンプライアンス

証言録取、聴聞会、収録された供述をタイムスタンプ付きで文字起こし — 行単位で引用可能、監査にも耐えます。

インタビュー・リサーチ

動画文字起こしツールが、定性調査の動画セッションをコーディングしやすい文字起こしに変換 — 話者は分かれており、分析ツールへすぐ投入できます。

字幕・キャプション制作

あらゆる動画プレーヤー向けに字幕用SRT/VTTを生成 — Premiere、DaVinci、Final Cut、YouTube Studioに対応します。

無料プラン — まず試してから

全アカウントで動画文字起こしを無料でお試しいただけます — 自分の素材でエンジンを確かめてください。クレジットカード不要、必要になったときだけ追加チャージ。

無料

毎月10分 全機能。登録不要。透かしなし。サブスクなし。

追加チャージ

$4.99から 分数パックを単発で購入。分数は失効しません — 月次リセットなし、サブスクなし。

プランを見る

動画文字起こしのFAQ

動画ファイルの文字起こしに取り組む方からよくいただく質問 — まっすぐお答えします。

動画文字起こしの精度は実際どのくらい?

スタジオ品質のクリーンな会話なら95〜98%です。交通騒音、撮影現場のBGM、強い方言が混じる現場収録は95%前後 — それを下回ることもあります。記載の数値は上限です。公開予定のものは必ず確認パスを見込んでください。

動画の解像度は文字起こしに影響しますか?

いいえ。解析するのは音声トラックのみです — 4K、1080p、480pでも処理速度と精度は同じ。重要なのは映像ではなく音声の品質です。

動画文字起こしにはどのくらい時間がかかりますか?

ファイルの長さと現在の負荷によって変わります。多くの動画は1時間あたり数分で完了しますが、長尺ファイルや混雑時は時間がかかります。進行状況はリアルタイムで表示され、タブを離れても問題ありません — バックグラウンドで処理を続けます。

音声の品質が悪い場合はどうなりますか?

文字起こし自体は返ってきますが、誤りが増えます。背景ノイズ、遠いマイク、声の重なりはAIが苦手とする領域です。エディタを開いて音声をスクラブしながら必要な行だけ修正し、エクスポートしてください。

ソースが違う場合はこちら

↑ ハブ音声文字起こし MP3、WAV、M4Aなど音声ファイルをアップロード。エンジンもエクスポート設定も同じです。 → YouTube YouTube 文字起こしツールファイルをアップロードする代わりにYouTubeのURLを貼り付け — 同じ話者ラベル、同じエクスポートパネルを使えます。 ↔ 逆方向テキスト読み上げ逆方向をお探しですか? テキストを100以上の言語のAI音声に変換できます。 → 字幕の音声化動画用SRTのナレーション SRTがすでにありますか? AIナレーションを生成して動画に焼き込めます。

当ウェブサイトでは、最高の体験を提供するためにクッキーを使用しています。詳細については、プライバシーポリシーをご覧ください。

必要分析
クッキーを許可

動画ファイルをテキストに文字起こし

書き出し

形式

書き出し設定

動画をテキストに文字起こしする手順 — 3ステップ

動画ファイルをアップロード

AIが文字起こし

設定してエクスポート

プライバシーとデータの取り扱い — 包み隠さず

通信は暗号化

3日後に自動削除

学習データには使用しません

GDPR準拠

動画をドロップ、編集タイムライン用SRTを取得

動画ファイルをドロップ

音声トラックを抽出して文字起こし

編集ソフトの字幕トラックにSRTをドロップ

対応する動画フォーマット

動画文字起こしを用途に合わせて設定

タイムラインにフレーム同期

ショットごと、シーンごとにラベル付け

編集レビューに最適化

翻訳者やスクリプト向けの素のテキスト

動画ソース全般で対応する言語

動画ファイル文字起こしのユースケース

会議・カンファレンス

教育コンテンツと講義

メディア・コンテンツ制作

法務・コンプライアンス

インタビュー・リサーチ

字幕・キャプション制作

無料プラン — まず試してから

無料

追加チャージ

動画文字起こしのFAQ

ソースが違う場合はこちら

動画ファイルをテキストに文字起こし

音声・動画をアップロード

書き出し

形式

書き出し設定

動画ファイルをアップロード

AIが文字起こし

設定してエクスポート

通信は暗号化

3日後に自動削除

学習データには使用しません

GDPR準拠

動画ファイルをドロップ

音声トラックを抽出して文字起こし

編集ソフトの字幕トラックにSRTをドロップ

タイムラインにフレーム同期

ショットごと、シーンごとにラベル付け

編集レビューに最適化

翻訳者やスクリプト向けの素のテキスト

会議・カンファレンス

教育コンテンツと講義

メディア・コンテンツ制作

法務・コンプライアンス

インタビュー・リサーチ

字幕・キャプション制作

無料プラン — まず試してから

無料

追加チャージ