Audio oder Video hochladen
MP3, WAV, MP4 per Drag & Drop — oder einen YouTube-Link einfügen. Dateien bis 1 GB und 3 Stunden.
Audio in Text umwandeln und in einem Schritt SRT/VTT-Untertitel erzeugen — mit Sprecher-Labels, Zeitstempeln, sofort einsetzbar in jedem Videoeditor.
Hochladen, KI arbeiten lassen, dann den Export an Ihren Workflow anpassen.
MP3, WAV, MP4 per Drag & Drop — oder einen YouTube-Link einfügen. Dateien bis 1 GB und 3 Stunden.
Unser Modell wandelt Sprache in Text um — mit 95–98% Genauigkeit, Zeitstempel pro Zeile und automatischen Sprecher-Labels.
Absatzrhythmus und Zeitstempel-Anzeige festlegen, dann als TXT für Redakteure, DOCX zur Korrektur oder SRT/VTT-Untertitel für jeden Player ausgeben.
Wenn Sie ein vertrauliches Interview, eine ärztliche Sitzung, eine juristische Aufnahme oder ein internes Meeting transkribieren, hier genau, was wir mit der Datei tun. Ohne Marketing-Floskeln.
Jede hochgeladene Audiodatei wird verschlüsselt übertragen, ebenso das fertige Transkript beim Abruf. SSL/TLS Ende-zu-Ende.
Audiodatei und Transkript werden 3 Tage nach dem Upload aus unserem Speicher entfernt. Brauchen Sie eine Kopie? Innerhalb dieses Zeitfensters herunterladen oder eine Erinnerung setzen.
Ihre Aufnahmen bleiben Ihre. Sie fließen in keine Trainingspipeline. Das Modell, das transkribiert, ist vortrainiert und eingefroren — Ihre Datei wird einmal verarbeitet und vergessen.
EU-Nutzer haben die üblichen Rechte — Kopie, Löschung, Datenübertragbarkeit — abrufbar im Konto oder über den Support. Jeder Upload liegt unter einer privaten URL, die ausschließlich dem erstellenden Konto zugeordnet ist.
Ihre Inhalte bleiben privat, verschlüsselt und vollständig unter Ihrer Kontrolle.
Audio, Video und YouTube auf der Eingangsseite — alle gängigen Transkriptformate auf der Ausgangsseite.
MP3WAVOGGOPUSAACM4AFLACAMRAIFF3GPWEBM
MP4MOVMKVWMVAVIWEBM
YouTubeYouTube Shorts
TXTDOCXPDFSRTVTTCSVZwischenablage
Audio rein — sauberes Transkript und eine in caption-freundliche Zeilenlängen segmentierte Untertiteldatei zurück. Das 38-Sekunden-Sample unten wird zu SRT und VTT (hervorgehoben) sowie TXT, DOCX, PDF und CSV. Genau das Format, das auch Ihre Datei liefern wird.
Sprecher 1 · 00:01
Wie sind Sie zum Tech-Journalismus gekommen?
Sprecher 2 · 00:05
Ehrlich gesagt, durch Zufall. Ich habe damals über das Rathaus berichtet…
Tech-Journalismus-Interview
Beispieltranskript · 0:38
Sprecher 1 · 00:01
Wie sind Sie zum Tech-Journalismus gekommen?
Faktisch ein eingebauter Untertitel-Generator: SRT- und VTT-Dateien sind auf caption-freundliche Zeilenlängen vorsegmentiert (≤ 42 Zeichen pro Zeile) — direkt einsetzbar in Premiere, DaVinci, Final Cut, CapCut oder YouTube Studio. Oder zuvor alle Ausgabeoptionen anpassen.
Die meisten Transkriptionstools liefern eine einzige Textwand. Unsere Engine trennt nach Sprecher, Pausenlänge und Absatzrhythmus — anpassbar an das nachgelagerte Werkzeug.
Auto-Erkennung oder feste Länge von 1, 2, 3, 4 oder 8 Zeilen pro Absatz. Praktisch, wenn Sie in ein Dokument einfügen, das einen eigenen Rhythmus vorgibt.
Auto1 Zeile2 Zeilen3 Zeilen4 Zeilen8 ZeilenDie KI startet einen neuen Absatz nach einer Pause. Pausenlänge nach Geschmack einstellen — kürzer für schnelles Sprechen, länger für ruhige Monologe.
500 ms700 ms (Standard)1500 msbenutzerdefiniertPro Absatz für schnelles Überfliegen, pro Phrase für juristische Zitierung, beides für vollständige Nachvollziehbarkeit oder ganz aus für sauberen Fließtext zur Veröffentlichung.
AbsätzePhrasenBeidesAusAutomatisch beschriftet als Sprecher 1 / Sprecher 2. Im Editor umbenennen — passend zu den Panelisten, Moderatoren oder Interviewpartnern, die Sie hochgeladen haben.
SprechernamenNach Sprecher zusammenfassenAusblendenEin Schalter reduziert das Transkript auf veröffentlichungsreifen Fließtext — bereit für einen Redakteur, einen LLM-Zusammenfasser oder zum Einfügen in einen CMS-Entwurf.
Reintext-ModusDen Datei-Schritt überspringen. Konfiguriertes Transkript direkt in Notion, Google Docs oder Ihr CMS einfügen — bereits in der richtigen Form.
In Zwischenablage kopierenDiese Sprachen liefern beim Modell konstant starke Ergebnisse. Auto-Detect wählt die richtige; gemischte Tonspuren funktionieren ebenfalls.
Liegt Ihre Aufnahme in einer selteneren Sprache vor, testen Sie zunächst ein 60-Sekunden-Sample im Free-Tarif.
Eine Spracherkennungs-Engine für jeden Workflow, der aus Ton Wörter machen muss.
Audio aus Interviews und Feldaufnahmen in Text umwandeln — Ausgabe mit Sprecher-Labels und ein Transkript-Generator, der auf schnelles Zitate-Heraussuchen ausgelegt ist.
Vorlesungen und Seminare in Lernnotizen verwandeln. Zeitstempel hinzufügen und überfliegen, statt erneut zuzuhören.
Ein Audio-zu-Text-Konverter, der zugleich als Show-Notes-Generator dient: MP3 reinwerfen, Blogtexte, Episodenzusammenfassungen und Kapitelmarken zurückbekommen.
Den eingebauten Untertitel-Generator nutzen, um SRT- und VTT-Dateien für YouTube, TikTok und jeden Videoplayer zu erzeugen.
Vernehmungen, Anhörungen und Besprechungen mit Zeitstempeln transkribieren — für zeilengenaue Belegprüfung.
Meeting-Aufnahme einwerfen und ein Transkript mit klaren To-dos zurückbekommen, fertig zum Einfügen in Ihr Dokumenten-Tool.
Transkriptionsqualität an eigenem Audio prüfen. Keine Kreditkarte. Erst aufladen, wenn Sie mehr Minuten brauchen.
Die häufigsten Fragen neuer Nutzer — direkt beantwortet.