논문과 학위논문
12쪽짜리 IEEE 논문, 학위논문 초고, arXiv에서 받은 강의 노트 — 화면을 훑어보는 대신 출퇴근길에 귀로 듣습니다. 다단 레이아웃과 각주는 내레이션 전에 자동으로 평탄화됩니다.
위쪽 에디터를 열고 도구 모음에서 파일 버튼을 눌러 PDF를 업로드하세요. 단 몇 초 만에 자연스러운 음성의 MP3가 만들어집니다 — 논문, 전자책, 장문 기사, 비즈니스 보고서까지 모두 가능합니다. SpeechGen은 텍스트 기반 PDF를 146개 언어로 소리내어 읽어주며, 5,000개가 넘는 내장 음성을 구동하는 동일한 엔진을 사용합니다. 별도의 프로그램 설치가 필요 없고, 처음 3,000자까지는 가입도 필요 없습니다.
브라우저에서 바로 실행되며 다운로드가 필요 없습니다. 짧은 문서는 몇 초 만에, 책 한 권 분량도 단 몇 분이면 끝납니다.
위쪽 에디터의 도구 모음에서 파일 버튼을 누르고 PDF를 선택합니다. 엔진은 텍스트 기반 PDF를 읽습니다 — Word, LaTeX, InDesign, 그리고 어떤 브라우저에서든 내보낸 파일이면 모두 지원됩니다.
146개 언어, 5,000개 이상의 음성 중에서 선택할 수 있습니다. 속도와 음높이를 조절하거나 특정 억양을 골라보세요. 변환 전에 미리듣기로 확인할 수 있습니다.
짧은 문서는 1분 이내, 책 한 권 분량도 몇 분이면 오디오가 완성됩니다. 계정에서 바로 스트리밍하거나 MP3로 내려받으세요.
매일 마주치는 네 가지 실제 사용 흐름입니다. 카드를 눌러 들어보세요 — 같은 엔진이며, 위쪽 에디터에 파일을 그대로 넣어 사용할 수 있습니다.
12쪽짜리 IEEE 논문, 학위논문 초고, arXiv에서 받은 강의 노트 — 화면을 훑어보는 대신 출퇴근길에 귀로 듣습니다. 다단 레이아웃과 각주는 내레이션 전에 자동으로 평탄화됩니다.
언어를 가리지 않는 책 한 권 분량의 PDF — 한국 단편선, 영미 문학 번역본, 일본 소설까지. 화자의 목소리는 수백 쪽이 지나도 흔들리지 않으며, 12장에 들어서도 음질이 떨어지지 않습니다.
분기 실적 보고서, 시장 조사 리포트, 임원 회의 안건 — 40쪽짜리 자료를 25분짜리 MP3로 만들어 출근길 지하철에서 듣습니다. Iapetus는 깔끔한 비즈니스 톤을 유지하면서도 기계적이지 않게 읽어줍니다.
매거진 에세이, Substack 롱리드, 한겨레 기획기사를 PDF로 내보낸 자료까지 — 30분짜리 읽을거리를 요리하면서 들을 수 있는 팟캐스트로 바꿉니다. Achernar는 잡지 내레이터 특유의 따뜻한 음색을 가졌습니다.
책 한 권 분량을 위한 프로 도구:
300쪽짜리 장편소설을 한 번의 합성으로 챕터별 MP3로 분리하려면 <cut> 태그를,
대화 장면에서 등장인물마다 다른 목소리를 부여하려면 <dialog> 태그를,
장면 사이의 정확한 극적 멈춤을 주려면 <break> 태그를 사용하세요. 각 태그마다 별도의 짧은 가이드가 마련되어 있습니다.
일반 TTS 엔진에 텍스트만 그대로 붙여넣을 때보다 이 도구가 더 잘하는 세 가지입니다.
2단 논문, 글머리표 목록, 제목과 캡션, 각주까지 — 텍스트 흐름이 구조를 인식하며 재구성됩니다. 읽기 순서는 페이지 그대로이며, 단을 무작위로 건너뛰지 않습니다. 머리글, 바닥글, 페이지 번호는 자동으로 걸러지므로 화자가 매분마다 "17쪽"이라고 말하는 일은 없습니다.
30쪽짜리 논문은 1분 이내, 200쪽 분량의 책도 3~5분이면 끝납니다. 수동으로 자르거나 챕터를 분리할 필요 없이 한 번 업로드하면 단일 MP3가 만들어집니다(목차 책갈피가 있는 경우 챕터 트랙으로 분할도 가능).
두세 개 언어가 섞인 문서 — 영문 초록과 국문 본문이 함께 있는 논문, 한영 이중 계약서, 출입국 서류 — 는 언어가 자동 감지되어 각 구간마다 알맞은 음성으로 내레이션됩니다. 미리 잘라 나눌 필요가 없습니다.
이 페이지 상단 에디터의 도구 모음에서 파일 버튼을 누르고 PDF를 선택한 다음, 음성과 언어를 고른 뒤 변환을 누르세요. 짧은 문서는 30초, 책 한 권 분량도 몇 분이면 MP3가 계정에 도착합니다. 별도의 설치는 필요 없습니다.
아니요 — 엔진은 텍스트 기반 PDF만 읽습니다(Word, LaTeX, InDesign, 그리고 어떤 브라우저에서든 내보낸 형태). 이미지 기반 PDF(스캔본 도서, 팩스 보고서, 문서 사진)는 무료 OCR 도구를 먼저 거쳐야 합니다 — Adobe Acrobat, ABBYY FineReader, 혹은 Google 드라이브의 내장 OCR도 충분합니다. 픽셀을 텍스트로 변환한 뒤 평소처럼 업로드하시면 됩니다.
네. 반복되는 머리글과 바닥글, 단독으로 놓인 페이지 번호는 걸러집니다. 그래서 화자가 매분 "17쪽"을 외치는 일이 없습니다. 챕터 제목과 섹션 헤딩은 그대로 유지되어 자연스러운 속도로 낭독됩니다.
표는 행 단위로 평탄화되며, 열 헤더는 각 행 앞에서 한 번만 읽힙니다. 그림과 도표 캡션은 등장한 자리에서 그대로 낭독됩니다. 각주는 본문 흐름에서 빠져 챕터 끝부분에 모아 읽혀, 문장의 호흡이 끊기지 않습니다.
아니요 — DRM 보호 파일과 암호로 잠긴 PDF는 법적·보안상의 이유로 업로드 단계에서 거부됩니다. 암호를 알고 있다면 어떤 PDF 도구로든 먼저 해제한 뒤 업로드해 주세요. 저희는 DRM을 우회하지 않습니다.
100쪽은 약 2분이면 처리됩니다(보통 속도 기준 약 3시간 분량의 MP3). 500쪽 책은 50 MB 업로드 한도를 넘기 때문에, PDF 도구로 2~3개 부분으로 나누어 각각 변환한 뒤 한 파일로 합치고 싶다면 MP3들을 이어 붙이세요.
PDF는 시작점일 뿐입니다. 같은 SpeechGen 계정으로 아래 도구들도 함께 사용하세요.
페이지 상단 에디터에서 파일을 누르세요. 처음 3,000자는 무료입니다 — 약 5쪽 분량의 오디오이며 카드 정보도 필요 없습니다. 이후에는 5달러부터.
PDF MP3 변환