Puja el fitxer de vídeo
Arrossega-hi MP4, MOV, MKV, WMV, AVI o WEBM — fins a 1 GB i 3 hores. L'àudio s'extreu automàticament.
Penja un MP4, MOV o AVI (fins a 1 GB) — transcriu el vídeo a text amb etiquetes de parlant i un SRT alineat amb els fotogrames per a Premiere, DaVinci o Final Cut.
Puja el fitxer de vídeo, deixa que la IA processi la pista d'àudio i, després, ajusta l'exportació.
Arrossega-hi MP4, MOV, MKV, WMV, AVI o WEBM — fins a 1 GB i 3 hores. L'àudio s'extreu automàticament.
El model converteix la veu en text amb un 95–98% de precisió, hi posa marques de temps a cada línia i assigna etiquetes de parlant.
Tria la longitud dels paràgrafs per a la revisió editorial i marques de temps per frase alineades amb els fotogrames per a la línia de temps; després, deixa anar el SRT a Premiere o DaVinci o envia el DOCX a un traductor.
Els fitxers de vídeo sovint contenen entrevistes confidencials, declaracions, sessions mèdiques o enregistraments interns. Així és exactament com tractem la pujada.
Les pujades MP4 d'1 GB van pel mateix canal TLS que fan servir els bancs per a les transaccions. L'extracció d'àudio i la recuperació de la transcripció es mantenen sobre HTTPS — res en pla a la xarxa.
El teu MP4 i la transcripció derivada es programen per a esborrat 3 dies després de la pujada. Si prems Suprimir a la pàgina del projecte, tots dos desapareixen al següent pas de neteja.
Les teves imatges no alimenten cap model. Extraiem l'àudio, transcrivim i descartem — sense arxivar el material, sense incloure'l en conjunts d'entrenament, sense fingerprinting de comportament.
Els clients de la UE tenen tots els drets de dades a cada pujada. Cada transcripció de vídeo viu en una URL imprevisible accessible només des del compte propietari del projecte.
El teu contingut de vídeo continua privat, xifrat i totalment sota el teu control.
L'àudio s'extreu, es transcriu i se segmenta amb línies aptes per a captions — el teu editor de vídeo llegeix el SRT directament.
Qualsevol contenidor habitual — MP4, MOV, MKV, WMV, AVI, WEBM, QT. Fins a 1 GB i 3 hores per fitxer. La resolució no importa — només llegim la pista d'àudio.
Extraiem l'àudio (sense recodificar la imatge), el passem pel model amb un 95–98% de precisió, etiquetem fins a 8 parlants i generem marques de temps lligades a la línia de temps original del clip.
Línies pre-segmentades a una llargada apta per a captions (≤ 42 caràcters). Marques de temps alineades amb els fotogrames en SRT HH:MM:SS,ms o VTT HH:MM:SS.ms — totes dues s'arrodoneixen a la velocitat de fotogrames del muntatge sense desviacions.
Conscient dels fotogrames per segon — funciona amb línies de temps de 24, 25, 29.97 i 30 fps sense desviacions de marca de temps.
Cada contenidor de vídeo habitual — tots els formats de transcripció habituals a la sortida.
MP4MOVMKVWMVAVIWEBMQT
fins a 1 GBfins a 3 horesqualsevol resolució
TXTDOCXPDFSRTVTTCSVPorta-retalls
La majoria de generadors de transcripció de vídeo escupen una sola paret de text. El nostre treu SRT i VTT alineats amb els fotogrames per a qualsevol NLE i, a més, DOCX amb paràgrafs ajustats per a la revisió editorial.
El gran avantatge per al vídeo. Marques de temps per paràgraf per als punts de tall editorials; marques per frase alineades amb els fotogrames per a la conformació línia per línia. Totes dues quan escrius el guió; desactivades en lliurar a un traductor.
Paràgrafs → punts de tallFrases → alineades amb fotogramesTots dosDesactivatCrític per a entrevistes documentals i material de panell. S'etiqueten automàticament per veu, després reanomena'ls per pla a l'editor — Director, Subjecte A, Subjecte B — o fusiona els torns consecutius quan un parlant domina una presa.
Noms de parlantFusionar per parlantAmagarDetecció automàtica o fixa cada paràgraf a 1, 2, 3, 4 o 8 línies. Ritme curt per a esborranys de subtítols; paràgrafs llargs per a la revisió editorial o per lliurar la transcripció a un traductor.
Auto1 línia2 línies3 línies4 línies8 líniesUn sol commutador treu marques de temps, etiquetes i format. El resultat encaixa net a les eines de memòria de traducció (Trados, MemoQ), a l'esborrany d'un guionista o a un resumidor d'IA.
Mode text plaDos controls més — talls per llindar de pausa i porta-retalls amb un clic — completen el panell. Veu'ls tots 6 al hub.
Aquests idiomes retornen amb fiabilitat en vídeo de documental, entrevista, congrés i enregistrament de camp. La detecció automàtica tria el correcte; els muntatges multilingües també funcionen.
Entrevista multilingüe enregistrada al camp? Prova un clip curt amb el pla gratuït abans de processar tot el material.
Un sol MP4 pujat — cada flux de treball aigües avall que necessita les paraules a la pantalla.
Penja l'enregistrament de Zoom o Teams, recupera una transcripció cercable amb etiquetes de parlant — perfecte per a accions a fer i actes.
Transcriu classes enregistrades, seminaris i cursos a la carta en apunts d'estudi — amb marques de temps per consultar-les ràpidament.
Un transcriptor de vídeo que extreu el diàleg i la narració de B-roll d'entrevistes i documentals — directe del MP4 al text a la línia de temps editorial.
Transcriu declaracions, vistes i testimonis enregistrats amb marques de temps — citables per línia, llestos per auditoria.
El generador de transcripció de vídeo converteix les sessions de recerca qualitativa en vídeo en transcripcions a punt per codificar — parlants separats, llestos per a eines d'anàlisi.
Genera SRT/VTT a punt per a captions per a qualsevol reproductor de vídeo — Premiere, DaVinci, Final Cut, YouTube Studio.
Transcripció de vídeo gratuïta a cada compte — prova el motor amb el teu propi material abans de comprometre-t'hi. Sense targeta. Recarrega només quan necessitis més minuts.
Les preguntes que més rebem de qui transcriu fitxers de vídeo — respostes sense embuts.