Audio & Video transkribieren — inklusive fertiger Untertitel

Dateien hierher ziehen oder klicken zum Auswählen
mp3, wav, ogg, opus, aac, m4a, flac, amr, aiff, aif, 3gp, webm, mp4, mov, mkv, wmv, avi

+Weitere Dateien hinzufügen

Sprache wählen

Modell wählen

Datei hochladen

YouTube konvertieren

	Dateiname	Datum	Dauer	Status

Historie

Audio in Text umwandeln und in einem Schritt SRT/VTT-Untertitel erzeugen — mit Sprecher-Labels, Zeitstempeln, sofort einsetzbar in jedem Videoeditor.

95–98% KI-Genauigkeit Transkript + SRT/VTT-Untertitel 3 Tage Aufbewahrung · kein Modelltraining 10 Min. gratis · keine Anmeldung · keine Kreditkarte

Audio transkribieren in 3 Schritten

Hochladen, KI arbeiten lassen, dann den Export an Ihren Workflow anpassen.

Audio oder Video hochladen

MP3, WAV, MP4 per Drag & Drop — oder einen YouTube-Link einfügen. Dateien bis 1 GB und 3 Stunden.

KI transkribiert

Unser Modell wandelt Sprache in Text um — mit 95–98% Genauigkeit, Zeitstempel pro Zeile und automatischen Sprecher-Labels.

Konfigurieren & exportieren

Absatzrhythmus und Zeitstempel-Anzeige festlegen, dann als TXT für Redakteure, DOCX zur Korrektur oder SRT/VTT-Untertitel für jeden Player ausgeben.

Datenschutz und Datenverarbeitung — Klartext

Wenn Sie ein vertrauliches Interview, eine ärztliche Sitzung, eine juristische Aufnahme oder ein internes Meeting transkribieren, hier genau, was wir mit der Datei tun. Ohne Marketing-Floskeln.

Verschlüsselt bei der Übertragung

Jede hochgeladene Audiodatei wird verschlüsselt übertragen, ebenso das fertige Transkript beim Abruf. SSL/TLS Ende-zu-Ende.

Nach 3 Tagen automatisch gelöscht

Audiodatei und Transkript werden 3 Tage nach dem Upload aus unserem Speicher entfernt. Brauchen Sie eine Kopie? Innerhalb dieses Zeitfensters herunterladen oder eine Erinnerung setzen.

Kein Training mit Ihren Daten

Ihre Aufnahmen bleiben Ihre. Sie fließen in keine Trainingspipeline. Das Modell, das transkribiert, ist vortrainiert und eingefroren — Ihre Datei wird einmal verarbeitet und vergessen.

DSGVO-konform

EU-Nutzer haben die üblichen Rechte — Kopie, Löschung, Datenübertragbarkeit — abrufbar im Konto oder über den Support. Jeder Upload liegt unter einer privaten URL, die ausschließlich dem erstellenden Konto zugeordnet ist.

Ihre Inhalte bleiben privat, verschlüsselt und vollständig unter Ihrer Kontrolle.

Unterstützte Formate

Audio, Video und YouTube auf der Eingangsseite — alle gängigen Transkriptformate auf der Ausgangsseite.

Audio rein

MP3WAVOGGOPUSAACM4AFLACAMRAIFF3GPWEBM

Video rein

MP4MOVMKVWMVAVIWEBM

URL rein

YouTubeYouTube Shorts

Transkript raus

TXTDOCXPDFSRTVTTCSVZwischenablage

Demo · nicht Ihre Datei

Von der Audiodatei zu fertigen Untertiteln

Audio rein — sauberes Transkript und eine in caption-freundliche Zeilenlängen segmentierte Untertiteldatei zurück. Das 38-Sekunden-Sample unten wird zu SRT und VTT (hervorgehoben) sowie TXT, DOCX, PDF und CSV. Genau das Format, das auch Ihre Datei liefern wird.

Audio rein · 0:38 Tech-Journalismus-Interview

Sprecher 1 Sprecher 2

Transkribieren & exportieren ↓

.srt · Untertiteldatei

1 00:00:01,200 --> 00:00:04,500 [Sprecher 1] Wie sind Sie zum Tech-Journalismus gekommen? 2 00:00:05,100 --> 00:00:13,800 [Sprecher 2] Ehrlich gesagt, durch Zufall. Ich habe damals...

.vtt · Untertiteldatei

WEBVTT 00:00:01.200 --> 00:00:04.500 <v Sprecher 1>Wie sind Sie zum Tech-Journalismus gekommen? 00:00:05.100 --> 00:00:13.800 <v Sprecher 2>Ehrlich gesagt, durch Zufall...

.txt

[00:01] Sprecher 1: Wie sind Sie zum Tech-Journalismus gekommen? [00:05] Sprecher 2: Ehrlich gesagt, durch Zufall. Ich habe damals über das Rathaus berichtet, und eine Quelle sagte ständig Dinge, die ich für die Leser übersetzen musste — da hat es Klick gemacht. [00:14] Sprecher 1: Wie lange hat es gedauert, bis Sie wussten, dass das Ihr Ressort ist?

.docx

Sprecher 1 · 00:01
Wie sind Sie zum Tech-Journalismus gekommen?

Sprecher 2 · 00:05
Ehrlich gesagt, durch Zufall. Ich habe damals über das Rathaus berichtet…

.pdf

Tech-Journalismus-Interview
Beispieltranskript · 0:38

Sprecher 1 · 00:01
Wie sind Sie zum Tech-Journalismus gekommen?

.csv

start,ende,sprecher,text 00:01,00:04,Sprecher 1,Wie sind Sie zum Tech-Journalismus gekommen? 00:05,00:13,Sprecher 2,Ehrlich gesagt durch Zufall...

Faktisch ein eingebauter Untertitel-Generator: SRT- und VTT-Dateien sind auf caption-freundliche Zeilenlängen vorsegmentiert (≤ 42 Zeichen pro Zeile) — direkt einsetzbar in Premiere, DaVinci, Final Cut, CapCut oder YouTube Studio. Oder zuvor alle Ausgabeoptionen anpassen.

Ausgabe so konfigurieren, wie Sie sie brauchen

Die meisten Transkriptionstools liefern eine einzige Textwand. Unsere Engine trennt nach Sprecher, Pausenlänge und Absatzrhythmus — anpassbar an das nachgelagerte Werkzeug.

Absatzlänge

Anpassen, wie lang jeder Absatz ist

Auto-Erkennung oder feste Länge von 1, 2, 3, 4 oder 8 Zeilen pro Absatz. Praktisch, wenn Sie in ein Dokument einfügen, das einen eigenen Rhythmus vorgibt.

Auto1 Zeile2 Zeilen3 Zeilen4 Zeilen8 Zeilen

Absatzumbrüche

Festlegen, wo neue Absätze beginnen

Die KI startet einen neuen Absatz nach einer Pause. Pausenlänge nach Geschmack einstellen — kürzer für schnelles Sprechen, länger für ruhige Monologe.

500 ms700 ms (Standard)1500 msbenutzerdefiniert

Zeitstempel

Zeitstempel dort anzeigen, wo Sie sie brauchen

Pro Absatz für schnelles Überfliegen, pro Phrase für juristische Zitierung, beides für vollständige Nachvollziehbarkeit oder ganz aus für sauberen Fließtext zur Veröffentlichung.

AbsätzePhrasenBeidesAus

Sprecher

Sprecher benennen oder Folgebeiträge zusammenfassen

Automatisch beschriftet als Sprecher 1 / Sprecher 2. Im Editor umbenennen — passend zu den Panelisten, Moderatoren oder Interviewpartnern, die Sie hochgeladen haben.

SprechernamenNach Sprecher zusammenfassenAusblenden

Reintext-Modus

Alles außer den Wörtern entfernen

Ein Schalter reduziert das Transkript auf veröffentlichungsreifen Fließtext — bereit für einen Redakteur, einen LLM-Zusammenfasser oder zum Einfügen in einen CMS-Entwurf.

Reintext-Modus

Zwischenablage

Kopieren, ohne eine Datei herunterzuladen

Den Datei-Schritt überspringen. Konfiguriertes Transkript direkt in Notion, Google Docs oder Ihr CMS einfügen — bereits in der richtigen Form.

In Zwischenablage kopieren

Sprachen mit nahezu muttersprachlicher Genauigkeit

Diese Sprachen liefern beim Modell konstant starke Ergebnisse. Auto-Detect wählt die richtige; gemischte Tonspuren funktionieren ebenfalls.

Englisch
Spanisch
Mandarin-Chinesisch
Portugiesisch
Deutsch
Französisch
Italienisch
Russisch
Japanisch
Koreanisch
Hindi
Arabisch

Liegt Ihre Aufnahme in einer selteneren Sprache vor, testen Sie zunächst ein 60-Sekunden-Sample im Free-Tarif.

Gebaut für Ihren Arbeitsalltag

Eine Spracherkennungs-Engine für jeden Workflow, der aus Ton Wörter machen muss.

Journalisten & Forschende

Audio aus Interviews und Feldaufnahmen in Text umwandeln — Ausgabe mit Sprecher-Labels und ein Transkript-Generator, der auf schnelles Zitate-Heraussuchen ausgelegt ist.

Lehrende & Studierende

Vorlesungen und Seminare in Lernnotizen verwandeln. Zeitstempel hinzufügen und überfliegen, statt erneut zuzuhören.

Podcaster & Creator

Ein Audio-zu-Text-Konverter, der zugleich als Show-Notes-Generator dient: MP3 reinwerfen, Blogtexte, Episodenzusammenfassungen und Kapitelmarken zurückbekommen.

Untertitel-Ersteller

Den eingebauten Untertitel-Generator nutzen, um SRT- und VTT-Dateien für YouTube, TikTok und jeden Videoplayer zu erzeugen.

Recht & Compliance

Vernehmungen, Anhörungen und Besprechungen mit Zeitstempeln transkribieren — für zeilengenaue Belegprüfung.

Teams & Meetings

Meeting-Aufnahme einwerfen und ein Transkript mit klaren To-dos zurückbekommen, fertig zum Einfügen in Ihr Dokumenten-Tool.

Kostenlos testen — vor dem Kauf

Transkriptionsqualität an eigenem Audio prüfen. Keine Kreditkarte. Erst aufladen, wenn Sie mehr Minuten brauchen.

Gratis

10 Minuten / Monat Voller Funktionsumfang. Keine Anmeldung. Kein Wasserzeichen. Kein Abo.

Aufladung

Ab $4.99 Einmalige Zahlung für ein Minutenpaket. Minuten verfallen nicht — kein monatliches Reset, kein Abo.

Tarife ansehen

FAQ zur Transkription

Die häufigsten Fragen neuer Nutzer — direkt beantwortet.

Wie genau ist die Transkription wirklich?

95–98% bei sauberer Sprache. Starke Akzente, Hintergrundgeräusche, sich überlagernde Stimmen oder komprimiertes Telefon-Audio drücken die Genauigkeit nach unten — manchmal deutlich unter 95%. Die Spitzenzahl ist die Obergrenze, nicht der Boden. Für alles, was Sie veröffentlichen oder zitieren, planen Sie eine Korrekturrunde im Editor ein.

Wie lange dauert die Transkription?

Hängt von der Dateilänge und der aktuellen Auslastung ab. Die meisten Dateien sind in wenigen Minuten pro Stunde Audio fertig; in Stoßzeiten oder bei längeren Uploads dauert es länger. Sie sehen den Fortschritt live und können den Tab schließen — wir arbeiten im Hintergrund weiter.

Was passiert, wenn die Audioqualität schlecht ist?

Das Transkript kommt trotzdem zurück, aber Sie müssen mit Fehlern rechnen. Hintergrundgeräusche, starke Akzente, zwei Personen, die gleichzeitig sprechen — hier tut sich die KI schwer. Öffnen Sie den eingebauten Editor, scrubben Sie das Audio beim Mitlesen, korrigieren Sie die wichtigen Zeilen und exportieren Sie. Die 3-tägige Aufbewahrung gibt Ihnen Zeit, das ohne Hektik zu erledigen.

Funktioniert die Spracherkennung auch jenseits der gelisteten Sprachen?

Oft ja — aber die Qualität schwankt. Weniger verbreitete Sprachen und regionale Dialekte werden mitunter ungenauer transkribiert als die gelisteten Top-Sprachen. Wir empfehlen, vorab ein kurzes Sample im Free-Tarif laufen zu lassen, um zu prüfen, ob das Ergebnis für Ihre konkrete Quelle brauchbar ist.

Kann ich ein Transkript mit jemandem teilen?

Ja. Jedes Transkript liegt unter einer eindeutigen URL — den Link mit den Personen teilen, die es sehen sollen, oder die Datei einfach herunterladen und per Mail verschicken. Beachten Sie, dass die Seite nach 3 Tagen automatisch gelöscht wird — Mitwirkende sollten sich rechtzeitig eine Kopie sichern, wenn sie längerfristigen Zugriff brauchen.

Weitere Transkriptionswerkzeuge

→ YouTube YouTube-Transkript-Generator URL einfügen, kompletten Text in 10–20 Minuten für 3-stündige Videos erhalten. → Video Video transkribieren MP4-, MOV- und AVI-Dateien bis 1 GB hochladen. Export als SRT, DOCX, TXT. ↔ Umgekehrt Text zu Sprache Suchen Sie die Gegenrichtung? Text in KI-Stimme umwandeln, in 100+ Sprachen. → Untertitel-Voiceover Vertonte Untertitel für Video Schon eine SRT-Datei? KI-Voiceover erzeugen und ins Video einbetten.

Wir benutzen Cookies, um Ihnen das beste Erlebnis auf der Website zu bieten. Mehr Informationen: Privacy Policy

Notwendig Analytik

Cookies akzeptieren

Audio & Video transkribieren — inklusive fertiger Untertitel

Exportieren

Formate

Export konfigurieren

Audio transkribieren in 3 Schritten

Audio oder Video hochladen

KI transkribiert

Konfigurieren & exportieren

Datenschutz und Datenverarbeitung — Klartext

Verschlüsselt bei der Übertragung

Nach 3 Tagen automatisch gelöscht

Kein Training mit Ihren Daten

DSGVO-konform

Unterstützte Formate

Von der Audiodatei zu fertigen Untertiteln

Ausgabe so konfigurieren, wie Sie sie brauchen

Anpassen, wie lang jeder Absatz ist

Festlegen, wo neue Absätze beginnen

Zeitstempel dort anzeigen, wo Sie sie brauchen

Sprecher benennen oder Folgebeiträge zusammenfassen

Alles außer den Wörtern entfernen

Kopieren, ohne eine Datei herunterzuladen

Sprachen mit nahezu muttersprachlicher Genauigkeit

Gebaut für Ihren Arbeitsalltag

Journalisten & Forschende

Lehrende & Studierende

Podcaster & Creator

Untertitel-Ersteller

Recht & Compliance

Teams & Meetings

Kostenlos testen — vor dem Kauf

Gratis

Aufladung

FAQ zur Transkription

Weitere Transkriptionswerkzeuge

Audio & Video transkribieren — inklusive fertiger Untertitel

Audio- oder Videodateien hochladen

Exportieren

Formate

Export konfigurieren

Audio oder Video hochladen

KI transkribiert

Konfigurieren & exportieren

Verschlüsselt bei der Übertragung

Nach 3 Tagen automatisch gelöscht

Kein Training mit Ihren Daten

DSGVO-konform

Anpassen, wie lang jeder Absatz ist

Festlegen, wo neue Absätze beginnen

Zeitstempel dort anzeigen, wo Sie sie brauchen

Sprecher benennen oder Folgebeiträge zusammenfassen

Alles außer den Wörtern entfernen

Kopieren, ohne eine Datei herunterzuladen

Journalisten & Forschende

Lehrende & Studierende

Podcaster & Creator

Untertitel-Ersteller

Recht & Compliance

Teams & Meetings

Kostenlos testen — vor dem Kauf

Gratis

Aufladung