음성 텍스트 변환 — 그리고 바로 사용 가능한 자막

×

파일을 드래그하거나 클릭하여 선택
mp3, wav, ogg, opus, aac, m4a, flac, amr, aiff, aif, 3gp, webm, mp4, mov, mkv, wmv, avi

+파일 추가

파일 선택
YouTube 변환
파일명 날짜 지속 시간 상태
×

내보내기


포맷

내보내기 설정

오디오를 텍스트로 받아쓰고 한 번의 업로드로 SRT/VTT 자막까지 — 화자 라벨과 타임스탬프가 포함되어 어떤 영상 편집 프로그램에서도 바로 사용할 수 있습니다.

AI 정확도 95–98% 전사문 + SRT/VTT 자막 3일 후 자동 삭제 · 학습에 사용 안 함 무료 10분 · 가입 불필요 · 신용카드 없이

음성을 텍스트로 변환하는 방법 — 3단계

파일을 올리고, AI가 작업하는 동안 기다린 다음, 작업 흐름에 맞게 내보내기를 조정하세요.

1

오디오 또는 동영상 업로드

MP3, WAV, MP4 파일을 끌어다 놓거나 YouTube 링크를 붙여넣으세요. 최대 1 GB, 3시간까지 지원합니다.

2

AI가 받아씁니다

모델이 95–98% 정확도로 음성 텍스트 변환을 수행하고, 모든 줄에 타임스탬프를 넣고, 화자를 구분해 라벨링합니다.

3

설정 후 내보내기

단락 리듬과 표시할 타임스탬프를 조정한 다음, 작가용 TXT, 검토용 DOCX, 또는 어떤 영상 플레이어에서도 사용할 수 있는 SRT/VTT 자막으로 내보내세요.

개인정보 보호와 데이터 처리 — 솔직하게

기밀 인터뷰, 진료 상담, 법률 녹취, 사내 회의를 받아쓰는 경우라면 파일이 어떻게 처리되는지 정확히 알려드립니다. 마케팅 수식어는 없습니다.

전송 중 암호화

업로드하는 모든 오디오 파일은 암호화되어 전송되며, 결과 전사문을 가져올 때도 마찬가지입니다. SSL/TLS 종단 간 암호화입니다.

3일 후 자동 삭제

오디오 파일과 전사문은 업로드 후 3일이 지나면 저장소에서 자동 삭제됩니다. 사본을 보관해야 한다면 그 안에 다운로드하거나 알림을 설정해 두세요.

고객 데이터로 학습하지 않음

녹음 파일은 고객의 자산으로 남습니다. 어떤 학습 파이프라인에도 들어가지 않습니다. 받아쓰는 모델은 사전 학습된 후 고정되어 있으며, 파일은 한 번 처리된 뒤 잊혀집니다.

GDPR 준수

EU 사용자는 사본 요청·삭제·이전 등 표준 권리를 보장받으며, 계정에서 직접 또는 지원팀을 통해 행사할 수 있습니다. 모든 업로드는 생성한 계정에 묶인 비공개 URL에 보관됩니다.

콘텐츠는 비공개로, 암호화된 채로, 전적으로 고객의 통제 아래 유지됩니다.

지원 포맷

들어오는 쪽은 오디오, 동영상, YouTube — 나가는 쪽은 흔히 쓰이는 모든 전사 포맷입니다.

오디오 입력
MP3WAVOGGOPUSAACM4AFLACAMRAIFF3GPWEBM
동영상 입력
MP4MOVMKVWMVAVIWEBM
URL 입력
YouTubeYouTube Shorts
전사문 출력
TXTDOCXPDFSRTVTTCSV클립보드
데모 · 실제 파일 아님

오디오 파일에서 바로 가져다 쓰는 자막까지

오디오를 올리면 깔끔한 전사문과 자막용 줄 길이로 분할된 자막 파일을 돌려받습니다. 아래 38초 샘플은 SRT와 VTT(강조 표시), 그리고 TXT, DOCX, PDF, CSV로 변환됩니다. 실제 파일에서도 동일한 형태의 결과물을 받게 됩니다.

오디오 입력 · 0:38 테크 저널리즘 인터뷰
화자 1 화자 2
전사 및 내보내기 ↓
.srt · 자막 파일
1 00:00:01,200 --> 00:00:04,500 [화자 1] 테크 저널리즘은 어떻게 시작하셨어요? 2 00:00:05,100 --> 00:00:13,800 [화자 2] 솔직히 우연이었어요. 그때 제가 취재하던 건...
.vtt · 자막 파일
WEBVTT 00:00:01.200 --> 00:00:04.500 <v 화자 1>테크 저널리즘은 어떻게 시작하셨어요? 00:00:05.100 --> 00:00:13.800 <v 화자 2>솔직히 우연이었어요...
.txt
[00:01] 화자 1: 테크 저널리즘은 어떻게 시작하셨어요? [00:05] 화자 2: 솔직히 우연이었어요. 시청을 취재하고 있었는데, 한 취재원이 자꾸 독자에게 풀어 설명해야 할 말을 하더라고요 — 그때 딱 감이 왔습니다. [00:14] 화자 1: 본인 분야라는 걸 깨닫는 데까지 얼마나 걸렸어요?
.docx

화자 1 · 00:01
테크 저널리즘은 어떻게 시작하셨어요?

화자 2 · 00:05
솔직히 우연이었어요. 시청을 취재하고 있었는데…

.pdf

테크 저널리즘 인터뷰
전사 샘플 · 0:38

화자 1 · 00:01
테크 저널리즘은 어떻게 시작하셨어요?

.csv
start,end,speaker,text 00:01,00:04,화자 1,테크 저널리즘은 어떻게 시작하셨어요? 00:05,00:13,화자 2,솔직히 우연이었어요...

사실상 자막 생성기가 내장된 셈입니다. SRT와 VTT 파일은 자막용 줄 길이(줄당 42자 이하)로 미리 분할되어 Premiere, DaVinci, Final Cut, CapCut, YouTube Studio에 바로 넣을 수 있습니다. 또는 모든 출력 옵션을 먼저 조정해도 됩니다.

필요한 방식대로 출력 설정하기

대부분의 음성 인식 도구는 한 덩어리의 텍스트만 내놓습니다. 우리는 화자별·휴지 길이별·단락 리듬별로 전사문을 나누고, 후속 도구에 맞게 미세 조정할 수 있게 합니다.

단락 길이

각 단락의 길이를 조정합니다

자동 감지하거나 모든 단락을 1줄, 2줄, 3줄, 4줄, 8줄로 고정하세요. 고유한 리듬을 가진 문서에 붙여 넣을 때 유용합니다.

자동1줄2줄3줄4줄8줄
단락 구분

새 단락이 시작되는 지점을 조정합니다

AI는 휴지 뒤에 새 단락을 시작합니다. 휴지 길이를 취향에 맞게 조절하세요 — 빠른 발화에는 짧게, 차분한 모놀로그에는 길게 설정합니다.

500 ms700 ms (기본)1500 ms사용자 지정
타임스탬프

원하는 위치에 타임스탬프 표시

훑어보기에는 단락 단위, 법적 인용 작업에는 구절 단위, 감사 추적에는 둘 다, 깔끔한 출판용 산문에는 끄기를 선택하세요.

단락구절둘 다끄기
화자

화자에 이름을 붙이거나 연속된 발화를 합치세요

화자 1 / 화자 2로 자동 라벨링됩니다. 에디터에서 업로드한 패널, 진행자, 인터뷰이의 실제 이름으로 바꿔 보세요.

화자 이름화자별 합치기숨기기
일반 텍스트 모드

문장만 남기고 모두 제거

토글 하나로 전사문이 출판용 산문으로 정리됩니다 — 작가, LLM 요약기, 또는 CMS 초안에 붙여넣기 좋은 형태입니다.

일반 텍스트 모드
클립보드

파일을 받지 않고 바로 복사

파일 단계를 건너뛰세요. 설정한 전사문을 Notion, Google Docs, 또는 사내 CMS에 그대로 붙여 넣을 수 있습니다 — 이미 원하는 형태로 정리되어 있습니다.

클립보드에 복사

원어민 수준의 정확도로 받아쓰는 언어들

모델이 일관되게 강력한 결과를 내는 언어 목록입니다. 자동 감지가 적절한 언어를 선택하며, 다국어가 섞인 클립도 처리합니다.

  • 영어
  • 스페인어
  • 중국어(만다린)
  • 포르투갈어
  • 독일어
  • 프랑스어
  • 이탈리아어
  • 러시아어
  • 일본어
  • 한국어
  • 힌디어
  • 아랍어

오디오가 사용 빈도가 낮은 언어라면 무료 요금제로 60초 샘플을 먼저 돌려 보세요.

당신의 작업 방식에 맞춰 설계됨

하나의 전사 엔진, 소리에서 글자를 뽑아야 하는 모든 작업 흐름.

기자와 연구자

인터뷰와 현장 녹음을 음성 텍스트 변환으로 처리하세요 — 화자별로 라벨링된 결과와 인용 발췌를 빠르게 뽑을 수 있는 받아쓰기 도구를 함께 제공합니다.

교육자와 학생

강의와 세미나를 학습 노트로 바꾸세요. 타임스탬프를 추가하면 다시 듣지 않고 훑어볼 수 있습니다.

팟캐스터와 크리에이터

쇼노트 생성기 역할도 하는 오디오 변환기입니다. MP3를 넣으면 블로그 재가공, 에피소드 요약, 챕터 큐를 받아볼 수 있습니다.

자막 제작자

내장된 자막 생성기로 YouTube, TikTok 등 어떤 영상 플레이어에서도 사용할 수 있는 SRT와 VTT 파일을 만드세요.

법무와 컴플라이언스

증언 녹취, 청문회, 회의를 줄 단위로 인용 검토할 수 있도록 타임스탬프와 함께 받아쓰기합니다.

팀과 회의

회의 녹음을 올리고 액션 아이템 중심으로 정리된 전사문을 받아 문서 도구에 바로 붙여 넣으세요.

무료 요금제 — 결제 전에 먼저 사용해 보세요

본인의 오디오로 전사 품질을 직접 테스트하세요. 신용카드 필요 없음. 더 많은 분량이 필요할 때만 충전하세요.

무료

월 10분 전체 기능. 가입 불필요. 워터마크 없음. 구독 없음.

충전

$4.99부터 분(分) 패키지에 대한 단건 결제. 분은 만료되지 않습니다 — 매월 초기화 없음, 구독 없음.
요금제 보기

음성 텍스트 변환 FAQ

신규 사용자에게 가장 자주 받는 질문 — 솔직하게 답합니다.

전사 정확도는 실제로 어느 정도인가요?
깨끗한 음성에서는 95–98%입니다. 강한 억양, 배경 소음, 겹쳐 말하는 목소리, 압축된 전화 음성은 정확도를 떨어뜨려 95% 아래로 내려가는 경우도 있습니다. 메인 수치는 천장이지 바닥이 아닙니다. 게시하거나 인용할 자료라면 에디터에서 한 번 검토하는 단계를 일정에 넣어 두세요.
전사하는 데 시간이 얼마나 걸리나요?
파일 길이와 현재 부하에 따라 다릅니다. 대부분의 파일은 오디오 한 시간당 몇 분 안에 끝나며, 사용량이 몰리는 시간대나 긴 업로드는 더 걸릴 수 있습니다. 진행률을 실시간으로 확인할 수 있고 탭을 닫아도 됩니다 — 백그라운드에서 작업이 계속됩니다.
오디오 품질이 나쁘면 어떻게 되나요?
전사문은 어쨌든 돌아오지만 오류가 있을 수 있습니다. 배경 소음, 두꺼운 억양, 동시에 말하는 두 사람 — AI가 가장 어려워하는 조건들입니다. 내장 에디터를 열어 오디오를 들으며 텍스트를 따라가면서 중요한 줄을 수정한 다음 내보내세요. 3일 보관 기간 덕분에 서두르지 않고 처리할 시간이 있습니다.
위 목록 외 언어도 지원되나요?
대체로 가능하지만 품질은 편차가 있습니다. 사용 빈도가 낮은 언어와 지역 방언은 위에 나열된 주요 언어보다 정확도가 떨어질 수 있습니다. 본인 자료에 쓸 만한지 확인하기 위해 무료 요금제로 짧은 샘플을 먼저 돌려 보시기를 권장합니다.
전사문을 다른 사람과 공유할 수 있나요?
예. 모든 전사문은 고유 URL에 보관됩니다 — 봐야 할 사람에게 링크를 공유하거나 파일을 다운로드해 이메일로 보내면 됩니다. 페이지가 3일 후 자동 삭제된다는 점만 기억하세요. 장기 접근이 필요한 협업자라면 사본을 받아 두는 것이 좋습니다.

다른 전사 도구

우리는 쿠키를 사용합니다 귀하가 당사 웹사이트에서 최상의 경험을 얻도록 보장합니다. 더 알아보세요: 개인정보 처리방침

쿠키 수락