音声または動画をアップロード
MP3、WAV、MP4をドラッグ&ドロップ、またはYouTubeリンクを貼り付け。最大1 GB、3時間まで対応。
音声 文字起こしとSRT/VTT字幕への変換を一度のアップロードで完結。話者ラベルとタイムスタンプ付き、どの動画編集ソフトにもそのまま使えます。
アップロード、AIが処理、エクスポート設定を整えるだけ。
MP3、WAV、MP4をドラッグ&ドロップ、またはYouTubeリンクを貼り付け。最大1 GB、3時間まで対応。
音声認識モデルが精度95–98%でテキスト化、各行にタイムスタンプを付与し、話者を自動でラベリングします。
段落の区切りや表示するタイムスタンプを調整して、ライター向けTXT、レビュー用DOCX、各種プレーヤー対応のSRT/VTT字幕として書き出せます。
機密インタビュー、医療セッション、法務記録、社内ミーティングを文字起こしする方へ。アップロードされたファイルをどう扱っているか、装飾なしでお伝えします。
アップロードされる音声ファイルも、生成されたテキストも、すべて暗号化された経路で送受信されます。SSL/TLSによるエンドツーエンド保護。
音声ファイルとその文字起こし結果は、アップロードから3日後にストレージから消去されます。コピーが必要な場合はその期間内にダウンロードしてください。
アップロードされた録音はお客様のものです。学習パイプラインには一切投入されません。文字起こしに使うモデルは事前学習済みで固定されており、ファイルは一度処理されたら忘れ去られます。
EUのユーザーには、コピー、削除、ポータビリティといった標準的な権利があり、アカウント画面またはサポート経由で行使できます。各アップロードは、作成元アカウントに紐づく非公開URLに保管されます。
あなたのコンテンツは非公開・暗号化され、完全にあなたの管理下に置かれます。
入力は音声・動画・YouTube、出力は主要なテキストフォーマットすべてに対応。
MP3WAVOGGOPUSAACM4AFLACAMRAIFF3GPWEBM
MP4MOVMKVWMVAVIWEBM
YouTubeYouTube Shorts
TXTDOCXPDFSRTVTTCSVクリップボード
音声を入れれば、整ったテキストと、字幕に適した行長で分割された字幕ファイルが返ってきます。下の38秒のサンプルはSRT・VTT(ハイライト)に加え、TXT、DOCX、PDF、CSVに変換されます。あなたのファイルでも同じ形式で出力されます。
話者1 · 00:01
テックジャーナリズムを始めたきっかけは何でしたか?
話者2 · 00:05
正直なところ、偶然ですね。市役所を担当していたとき…
テックジャーナリズムのインタビュー
サンプル文字起こし · 0:38
話者1 · 00:01
テックジャーナリズムを始めたきっかけは何でしたか?
実質的に字幕ジェネレーター内蔵: SRTとVTTファイルは字幕向けの行長(1行42文字以内)で事前分割されており、Premiere、DaVinci、Final Cut、CapCut、YouTube Studioにそのまま投入できます。先に出力設定をすべて調整することも可能です。
ほとんどの文字起こしツールはテキストを一塊で吐き出すだけ。SpeechGenは話者・無音の長さ・段落のリズムでテキストを分割でき、後工程のツールに合わせて調整できます。
自動検出にするか、各段落を1行・2行・3行・4行・8行に固定できます。独自のリズムを持つドキュメントに貼り付けるときに便利です。
自動1行2行3行4行8行AIは無音のあとに新しい段落を始めます。無音の長さは好みに合わせて調整可能 — 速い発話には短め、ゆったりしたモノローグには長めに。
500 ms700 ms (デフォルト)1500 msカスタムざっと確認したいなら段落単位、法的引用には文単位、完全な記録には両方、公開用のきれいな本文にはオフを。
段落文両方オフ自動で話者1 / 話者2とラベル付けされます。エディタで名前を変更し、アップロードしたパネリスト、ホスト、インタビュー対象に合わせられます。
話者名話者ごとに統合非表示ワンクリックで文字起こしを公開可能な本文に折り畳めます — ライター、LLM要約、CMSの下書きへの貼り付けに最適です。
プレーンテキストモードファイル化の手間を省略。設定済みの文字起こしを、整った形式のままNotion、Google Docs、CMSに直接貼り付けられます。
クリップボードにコピー以下はモデルが安定して高品質な結果を出す言語です。自動検出が言語を判別し、複数言語が混在する音声にも対応します。
対応言語以外の音声を扱う場合は、無料枠で60秒のサンプルを試してから本番に進んでください。
ひとつの文字起こしエンジンで、音から言葉を必要とするあらゆる業務をカバー。
インタビューやフィールド録音の音声 文字起こしに。話者ラベル付きの出力と、引用の素早い抽出を想定したテキスト生成機能を提供します。
講義やゼミを学習用ノートに変換。タイムスタンプを付ければ、もう一度聞き直さずに必要な箇所だけ確認できます。
音声からテキストへ変換するツールであり、同時にショーノート生成器でもあります。MP3を投入すれば、ブログ転用、エピソード要約、チャプター情報を取得できます。
内蔵の字幕ジェネレーターで、YouTube、TikTok、各種動画プレーヤー向けのSRT・VTTファイルを作成できます。
証言録取、聴聞会、会議の録音 文字起こしを、タイムスタンプ付きで行ない、行単位の引用レビューに活用できます。
会議の録音をアップロードすれば、アクションアイテム入りの文字起こしが得られ、ドキュメントツールへそのまま貼り付けられます。
実際の音声で精度を確かめてください。クレジットカード不要。必要になったときだけ追加チャージ。
新規ユーザーから多く寄せられる質問に、率直にお答えします。