Àudio i vídeo a text — i subtítols a punt per fer servir

×

Arrossega fitxers aquí o selecciona'n
mp3, wav, ogg, opus, aac, m4a, flac, amr, aiff, aif, 3gp, webm, mp4, mov, mkv, wmv, avi

+Pujar-ne més

Final
YouTube a text
Nom Data Durada Estat
×

Exportar


It

Configurar Exportació

Fes la transcripció d'àudio a text i converteix-lo a subtítols SRT/VTT en una sola pujada — amb etiquetes de parlant, marques de temps i llest per a qualsevol editor de vídeo.

95–98% precisió IA Transcripció + subtítols SRT/VTT Retenció 3 dies · sense entrenament 10 min gratis · sense registre · sense targeta

Com transcriure àudio a text — 3 passos

Puja el fitxer, deixa que la IA treballi i, després, ajusta l'exportació al teu flux de treball.

1

Puja l'àudio o el vídeo

Arrossega-hi MP3, WAV, MP4 — o enganxa un enllaç de YouTube. Fitxers de fins a 1 GB i 3 hores.

2

La IA transcriu

El nostre model converteix la veu en text amb un 95–98% de precisió, hi posa marques de temps a cada línia i etiqueta els parlants.

3

Configura i exporta

Ajusta el ritme dels paràgrafs i quines marques de temps apareixen, i exporta com a TXT per a redactors, DOCX per a revisió o subtítols SRT/VTT per a qualsevol reproductor.

Privacitat i tractament de dades — sense embuts

Si transcrius una entrevista confidencial, una sessió mèdica, un enregistrament jurídic o una reunió interna, així és com tractem el fitxer. Sense floritures de màrqueting.

Xifrat en trànsit

Cada fitxer d'àudio que puges viatja xifrat, igual que la transcripció resultant quan la recuperes. SSL/TLS d'extrem a extrem.

S'esborra automàticament al cap de 3 dies

El teu fitxer d'àudio i la seva transcripció s'esborren del nostre emmagatzematge 3 dies després de la pujada. Vols conservar-ne una còpia? Descarrega-la abans o posa't un recordatori.

No entrenem amb les teves dades

Els teus enregistraments són teus. No entren en cap procés d'entrenament. El model que els transcriu està preentrenat i congelat — el teu fitxer es processa una vegada i s'oblida.

Compatible amb el RGPD

Els usuaris de la UE conserven els drets habituals — còpia, supressió, portabilitat — exercibles des del compte o amb suport. Cada pujada queda en una URL privada lligada al compte que la va crear.

El teu contingut continua privat, xifrat i totalment sota el teu control.

Formats compatibles

Àudio, vídeo i YouTube a l'entrada — tots els formats habituals de transcripció a la sortida.

Àudio entrant
MP3WAVOGGOPUSAACM4AFLACAMRAIFF3GPWEBM
Vídeo entrant
MP4MOVMKVWMVAVIWEBM
URL
YouTubeYouTube Shorts
Transcripció sortint
TXTDOCXPDFSRTVTTCSVPorta-retalls
Demo · no és el teu fitxer

D'un fitxer d'àudio a uns subtítols a punt

Penja un àudio i recupera una transcripció neta i un fitxer de subtítols segmentat amb línies aptes per a captions. La mostra de 38 segons d'aquí sota es converteix a SRT i VTT (ressaltats), i també a TXT, DOCX, PDF i CSV. La mateixa forma de sortida que tindrà el teu fitxer.

Àudio d'entrada · 0:38 Entrevista de periodisme tecnològic
Parlant 1 Parlant 2
Transcriure i exportar ↓
.srt · Fitxer de subtítols
1 00:00:01,200 --> 00:00:04,500 [Parlant 1] Què et va fer començar en periodisme tecnològic? 2 00:00:05,100 --> 00:00:13,800 [Parlant 2] Sincerament, per accident. Estava cobrint...
.vtt · Fitxer de subtítols
WEBVTT 00:00:01.200 --> 00:00:04.500 <v Parlant 1>Què et va fer començar en periodisme tecnològic? 00:00:05.100 --> 00:00:13.800 <v Parlant 2>Sincerament, per accident...
.txt
[00:01] Parlant 1: Què et va fer començar en periodisme tecnològic? [00:05] Parlant 2: Sincerament, per accident. Estava cobrint l'ajuntament, i una font deia coses que havia de traduir per als lectors — aquell va ser el clic. [00:14] Parlant 1: Quant vas trigar a saber que era la teva secció?
.docx

Parlant 1 · 00:01
Què et va fer començar en periodisme tecnològic?

Parlant 2 · 00:05
Sincerament, per accident. Estava cobrint l'ajuntament…

.pdf

Entrevista de periodisme tecnològic
Mostra de transcripció · 0:38

Parlant 1 · 00:01
Què et va fer començar en periodisme tecnològic?

.csv
inici,fi,parlant,text 00:01,00:04,Parlant 1,Què et va fer començar en periodisme tecnològic? 00:05,00:13,Parlant 2,Sincerament per accident...

És, de fet, un generador de subtítols incorporat: els fitxers SRT i VTT vénen segmentats amb línies aptes per a captions (≤ 42 caràcters per línia) — arrossega'ls directament a Premiere, DaVinci, Final Cut, CapCut o YouTube Studio. O ajusta abans tots els controls d'exportació.

Configura la sortida com et convingui

La majoria d'eines de transcripció bolquen un sol bloc de text. La nostra divideix la transcripció per parlant, per durada de pausa i per ritme de paràgraf — tot ajustable a l'eina amb què treballis després.

Llargada de paràgraf

Ajusta la llargada de cada paràgraf

Detecció automàtica o fixa cada paràgraf a 1, 2, 3, 4 o 8 línies. Útil quan enganxes en un document que té el seu propi ritme.

Auto1 línia2 línies3 línies4 línies8 línies
Salts de paràgraf

Ajusta on comencen els paràgrafs nous

La IA inicia un paràgraf nou després d'una pausa. Ajusta'n la durada al teu gust — més curta per a parla ràpida, més llarga per a monòleg pausat.

500 ms700 ms (per defecte)1500 mspersonalitzat
Marques de temps

Mostra marques de temps allà on les vulguis

Per paràgraf per a una revisió ràpida, per frase per a citacions jurídiques per línia, totes dues per al registre complet, o desactivades per a prosa publicable.

ParàgrafsFrasesTotes duesSense marques
Parlants

Posa noms als parlants o fusiona torns consecutius

Etiquetats automàticament com a Parlant 1 / Parlant 2. Reanomena'ls a l'editor perquè coincideixin amb els ponents, presentadors o entrevistats que has pujat.

Noms de parlantsFusionar per parlantAmaga
Mode text pla

Treu-ho tot menys les paraules

Un sol interruptor redueix la transcripció a prosa publicable — llesta per a un redactor, per a un resumidor LLM o per enganxar en un esborrany del CMS.

Mode text pla
Porta-retalls

Copia sense descarregar cap fitxer

Salta't el pas del fitxer. Enganxa la transcripció configurada directament a Notion, Google Docs o el teu CMS — ja amb la forma correcta.

Copia al porta-retalls

Idiomes que transcrivim amb precisió quasi nativa

Aquests són els idiomes en què el model dóna resultats sòlids de manera consistent. La detecció automàtica tria el correcte; els clips multilingües també funcionen.

  • Anglès
  • Espanyol
  • Xinès mandarí
  • Portuguès
  • Alemany
  • Francès
  • Italià
  • Rus
  • Japonès
  • Coreà
  • Hindi
  • Àrab

Si l'àudio és en una llengua menys habitual, prova primer una mostra de 60 segons amb el pla gratuït.

Pensat per a com treballes

Un sol motor de transcripció, per a tots els fluxos que necessiten paraules a partir del so.

Periodistes i investigadors

Transcriu àudio a text d'entrevistes i enregistraments de camp — sortida amb etiquetes de parlant i un generador de transcripcions pensat per extreure cites de pressa.

Docents i estudiants

Converteix classes i seminaris en apunts d'estudi. Afegeix-hi marques de temps i fes una lectura ràpida en lloc de tornar a escoltar-ho tot.

Podcasters i creadors

Un convertidor d'àudio a text que també fa de generador de notes: hi entres un MP3 i n'obtens reaprofitaments per al blog, resums d'episodi i marques de capítol.

Creadors de subtítols

Fes servir el generador de subtítols incorporat per produir fitxers SRT i VTT per a YouTube, TikTok i qualsevol reproductor de vídeo.

Jurídic i compliment

Transcriu declaracions, vistes i reunions amb marques de temps per a la revisió amb citació per línia.

Equips i reunions

Penja un enregistrament de reunió i obtén una transcripció amb tasques accionables, llesta per enganxar a la teva eina de documents.

Pla gratuït — prova-ho abans de comprometre't

Comprova la qualitat de la transcripció amb el teu propi àudio. Sense targeta. Recarrega només quan necessitis més minuts.

Gratuït

10 minuts / mes Totes les funcions. Sense registre. Sense marca d'aigua. Sense subscripció.

Recàrrega

Des de $4.99 Pagament únic per un paquet de minuts. Els minuts no caduquen — sense reinici mensual, sense subscripció.
Veure plans

Preguntes freqüents sobre transcripció

Les preguntes que més rebem dels nous usuaris — respostes clares.

Com de precisa és la transcripció, realment?
95–98% amb veu neta. Accents marcats, soroll de fons, veus encavalcades o àudio comprimit de telèfon fan baixar la precisió — de vegades molt per sota del 95%. La xifra principal és el sostre, no el terra. Per a qualsevol cosa que vulguis publicar o citar, planifica una passada de revisió a l'editor.
Quant triga la transcripció?
Depèn de la durada del fitxer i de la càrrega del moment. La majoria de fitxers s'acaben en pocs minuts per cada hora d'àudio; els períodes de molta demanda o les pujades més llargues triguen més. Veuràs el progrés en directe i pots tancar la pestanya — continuem treballant en segon pla.
Què passa si l'àudio és de mala qualitat?
La transcripció arribarà igualment, però espera errors. Soroll de fons, accents tancats, dues persones parlant alhora — aquí és on la IA falla. Obre l'editor incorporat, navega per l'àudio mentre llegeixes, corregeix les línies que importen i exporta. La retenció de 3 dies et dóna marge per fer-ho sense pressa.
Més enllà dels idiomes llistats, funciona?
Sovint sí — però la qualitat varia. Les llengües menys comunes i els dialectes regionals poden transcriure's amb menys precisió que els idiomes principals llistats. Recomanem provar primer una mostra curta amb el pla gratuït per veure si el resultat és utilitzable per a la teva font concreta.
Puc compartir una transcripció amb una altra persona?
Sí. Cada transcripció viu en una URL única — comparteix l'enllaç amb qui l'hagi de veure, o simplement descarrega i envia el fitxer per correu. Recorda que la pàgina s'esborra automàticament al cap de 3 dies, així que els col·laboradors n'han de quedar-se una còpia si necessiten accés a llarg termini.

Altres eines de transcripció

Utilitzem cookies per a assegurar-nos que obtinguis la millor experiència en el nostre lloc web. Més informació: Política de privacitat

Acceptar Cookies