Ljud och video till text — med färdiga undertexter

×

Dra och släpp filer här eller klicka för att välja
mp3, wav, ogg, opus, aac, m4a, flac, amr, aiff, aif, 3gp, webm, mp4, mov, mkv, wmv, avi

+Lägg till fler filer

Ladda upp fil
Konvertera Youtube
Filnamn Datum Varaktighet Status
×

Exportera


Format

Konfigurera export

Transkribera ljud till text och konvertera till SRT/VTT-undertexter i en enda uppladdning — med talaretiketter, tidsstämplar och redo för valfri videoredigerare.

95–98 % AI-noggrannhet Transkript + SRT/VTT-undertexter 3-dagars lagring · ingen modellträning Gratis 10 min · ingen registrering · inget kreditkort

Så här transkriberar du ljud till text — 3 steg

Ladda upp, låt AI:n arbeta och justera sedan exporten efter ditt arbetsflöde.

1

Ladda upp ljud eller video

Dra och släpp MP3, WAV, MP4 — eller klistra in en YouTube-länk. Filer upp till 1 GB och 3 timmar.

2

AI:n transkriberar

Vår modell omvandlar tal till text med 95–98 % noggrannhet, sätter tidsstämpel på varje rad och märker upp talare.

3

Konfigurera och exportera

Justera styckesrytm och vilka tidsstämplar som visas, och leverera sedan som TXT för skribenter, DOCX för granskning eller SRT/VTT-undertexter för valfri spelare.

Integritet och datahantering — rakt på sak

Om du transkriberar en konfidentiell intervju, en vårdsession, en juridisk inspelning eller ett internt möte — så här hanterar vi filen. Utan marknadsförings­fluff.

Krypterad överföring

Varje ljudfil du laddar upp skickas krypterad, och det gäller även transkriptet du hämtar tillbaka. SSL/TLS från ände till ände.

Raderas automatiskt efter 3 dagar

Din ljudfil och dess transkript tas bort från vår lagring 3 dagar efter uppladdning. Behöver du behålla en kopia? Ladda ner den inom det fönstret eller sätt en påminnelse.

Ingen träning på dina data

Dina ljudinspelningar förblir dina. De går inte in i någon träningsprocess. Modellen som transkriberar dem är förtränad och fryst — din fil bearbetas en gång och glöms sedan bort.

GDPR-anpassad

EU-användare har de vanliga rättigheterna — kopia, radering, dataportabilitet — och kan utöva dem från sitt konto eller via supporten. Varje uppladdning ligger på en privat URL kopplad till kontot som skapade den.

Ditt innehåll förblir privat, krypterat och helt under din kontroll.

Format som stöds

Ljud, video och YouTube in — alla vanliga transkriptformat ut.

Ljud in
MP3WAVOGGOPUSAACM4AFLACAMRAIFF3GPWEBM
Video in
MP4MOVMKVWMVAVIWEBM
URL in
YouTubeYouTube Shorts
Transkript ut
TXTDOCXPDFSRTVTTCSVUrklipp
Demo · inte din fil

Från ljudfil till färdiga undertexter

Lägg in ljudet — få tillbaka ett rent transkript och en undertextfil segmenterad till radlängder anpassade för bildtexter. 38-sekundersexemplet nedan konverteras till SRT och VTT (markerade) samt TXT, DOCX, PDF och CSV. Samma format din fil kommer att producera.

Ljud in · 0:38 Intervju inom teknikjournalistik
Talare 1 Talare 2
Transkribera och exportera ↓
.srt · Undertextfil
1 00:00:01,200 --> 00:00:04,500 [Talare 1] Vad fick dig att börja med teknikjournalistik? 2 00:00:05,100 --> 00:00:13,800 [Talare 2] Ärligt talat, av en slump. Jag bevakade...
.vtt · Undertextfil
WEBVTT 00:00:01.200 --> 00:00:04.500 <v Talare 1>Vad fick dig att börja med teknikjournalistik? 00:00:05.100 --> 00:00:13.800 <v Talare 2>Ärligt talat, av en slump...
.txt
[00:01] Talare 1: Vad fick dig att börja med teknikjournalistik? [00:05] Talare 2: Ärligt talat, av en slump. Jag bevakade kommunfullmäktige, och en källa fortsatte säga saker jag fick översätta för läsarna — det var där det klickade. [00:14] Talare 1: Hur lång tid tog det innan du visste att det var ditt område?
.docx

Talare 1 · 00:01
Vad fick dig att börja med teknikjournalistik?

Talare 2 · 00:05
Ärligt talat, av en slump. Jag bevakade kommunfullmäktige…

.pdf

Intervju inom teknikjournalistik
Transkriptexempel · 0:38

Talare 1 · 00:01
Vad fick dig att börja med teknikjournalistik?

.csv
start,slut,talare,text 00:01,00:04,Talare 1,Vad fick dig att börja med teknikjournalistik? 00:05,00:13,Talare 2,Ärligt talat av en slump...

I praktiken en inbyggd undertextgenerator: SRT- och VTT-filer är förberedda med radlängder anpassade för bildtexter (≤ 42 tecken per rad) — släpp dem direkt in i Premiere, DaVinci, Final Cut, CapCut eller YouTube Studio. Eller justera alla utdatainställningar först.

Konfigurera utdata precis som du behöver

De flesta transkriberings­verktyg spottar ut en enda textmassa. Vi delar upp transkriptet per talare, efter pauslängd och styckesrytm — anpassningsbart för verktyget du använder efteråt.

Styckeslängd

Justera hur långt varje stycke är

Automatisk identifiering eller fast längd på 1, 2, 3, 4 eller 8 rader per stycke. Användbart när du klistrar in i ett dokument som har sin egen rytm.

Auto1 rad2 rader3 rader4 rader8 rader
Styckesbrytningar

Ställ in var nya stycken börjar

AI:n påbörjar ett nytt stycke efter en paus. Justera pauslängden efter smak — kortare för snabbt tal, längre för lugn monolog.

500 ms700 ms (standard)1500 msanpassat
Tidsstämplar

Visa tidsstämplar där du vill ha dem

Per stycke för snabb genomläsning, per fras för juridisk citering, båda för fullständigt revisionsspår, eller av för publicerbar prosa.

StyckenFraserBådaAv
Talare

Namnge talare eller slå ihop följdrepliker

Märks automatiskt som Talare 1 / Talare 2. Byt namn i editorn så de matchar paneldeltagarna, värdarna eller intervjupersonerna du laddat upp.

TalarnamnSlå ihop per talareDölj
Ren text-läge

Ta bort allt utom orden

En enda växel kollapsar transkriptet till publicerbar prosa — redo för en skribent, en LLM-sammanfattare eller att klistra in i ett CMS-utkast.

Ren text-läge
Urklipp

Kopiera utan att ladda ner en fil

Hoppa över filsteget. Klistra in det konfigurerade transkriptet direkt i Notion, Google Docs eller ditt CMS — redan i rätt form.

Kopiera till urklipp

Språk vi transkriberar med nästan modersmålsnoggrannhet

Det här är språken där modellen levererar konsekvent starka resultat. Automatisk identifiering väljer rätt språk; klipp med blandat språk fungerar också.

  • Engelska
  • Spanska
  • Mandarin
  • Portugisiska
  • Tyska
  • Franska
  • Italienska
  • Ryska
  • Japanska
  • Koreanska
  • Hindi
  • Arabiska

Om ditt ljud är på ett mindre vanligt språk — kör först ett 60-sekunderssample på gratisnivån.

Byggd för ditt sätt att arbeta

En enda transkriptmotor — varje arbetsflöde som behöver ord från ljud.

Journalister och forskare

Transkribera ljud till text från intervjuer och fältinspelningar — utdata med talaretiketter och en transkriptgenerator gjord för snabb citatplockning.

Lärare och studenter

Förvandla föreläsningar och seminarier till studieanteckningar. Lägg till tidsstämplar och skumma istället för att lyssna om.

Poddare och kreatörer

En ljud-till-text-omvandlare som även fungerar som show-notes-generator: mata in en MP3 och få bloggåteranvändning, avsnittssammanfattningar och kapitelmarkörer.

Undertextskapare

Använd den inbyggda undertextgeneratorn för att producera SRT- och VTT-filer för YouTube, TikTok och valfri videospelare.

Juridik och regelefterlevnad

Transkribera vittnesförhör, förhandlingar och möten med tidsstämplar för radvis källgranskning.

Team och möten

Släpp in en mötesinspelning och få ett transkript med åtgärdspunkter, redo att klistra in i ditt dokumentverktyg.

Gratisnivå — testa innan du binder dig

Testa transkriptkvaliteten på ditt eget ljud. Inget kreditkort. Fyll på endast när du behöver fler minuter.

Gratis

10 minuter / månad Alla funktioner. Ingen registrering. Ingen vattenstämpel. Ingen prenumeration.

Påfyllning

Från $4.99 Engångsbetalning för ett minutpaket. Minuterna går aldrig ut — ingen månatlig nollställning, ingen prenumeration.
Se planer

Vanliga frågor om transkribering

Frågorna vi får oftast från nya användare — besvarade rakt och tydligt.

Hur noggrann är transkriberingen, egentligen?
95–98 % på rent tal. Tunga dialekter, bakgrundsljud, överlappande röster eller komprimerat telefonljud drar ner noggrannheten — ibland långt under 95 %. Den viktigaste siffran är taket, inte golvet. För allt du ska publicera eller citera bör du planera in en granskningsrunda i editorn.
Hur lång tid tar transkriberingen?
Det beror på filens längd och aktuell belastning. De flesta filer blir klara inom några minuter per timme ljud; under hög belastning eller med längre uppladdningar tar det längre tid. Du ser progressen i realtid och kan stänga fliken — vi fortsätter arbeta i bakgrunden.
Vad händer om mitt ljud har dålig kvalitet?
Transkriptet kommer ändå tillbaka, men räkna med fel. Bakgrundsljud, kraftiga dialekter, två personer som pratar samtidigt — det är där AI:n får problem. Öppna den inbyggda editorn, scrolla i ljudet medan du läser, rätta de rader som är viktiga och exportera. 3-dagarslagringen ger dig ett fönster att göra det utan stress.
Fungerar det utöver de listade språken?
Ofta, ja — men kvaliteten varierar. Mindre vanliga språk och regionala dialekter kan transkriberas med lägre noggrannhet än de listade huvudspråken. Vi rekommenderar att du först kör ett kort prov på gratisnivån för att se om resultatet är användbart för just din källa.
Kan jag dela ett transkript med någon annan?
Ja. Varje transkript ligger på en unik URL — dela länken med dem som ska se det, eller ladda bara ner och mejla filen. Tänk på att sidan raderas automatiskt efter 3 dagar, så samarbetspartner bör spara en kopia om de behöver långsiktig åtkomst.

Andra transkriberingsverktyg

Vi använder cookies för att säkerställa att du får den bästa upplevelsen på vår webbplats. Läs mer: Sekretesspolicy

Acceptera cookies