Makalah riset & tesis
Paper IEEE 12 halaman, draf disertasi, catatan kuliah dari arXiv — dengarkan dalam perjalanan alih-alih membacanya di layar. Tata letak multikolom dan catatan kaki diratakan otomatis sebelum narasi.
Buka editor di atas, klik File pada toolbar untuk mengunggah PDF Anda, dan dapatkan MP3 dengan suara alami dalam hitungan detik — makalah riset, ebook, artikel panjang, laporan bisnis. SpeechGen membaca PDF apa pun dengan suara dalam 146 bahasa menggunakan mesin yang sama dengan 5.000+ suara bawaan kami. Tanpa instal aplikasi, tanpa daftar untuk 3.000 karakter pertama.
Berjalan di browser, tanpa unduhan. Dokumen pendek selesai dalam hitungan detik, buku utuh dalam beberapa menit.
Pada editor di atas, klik tombol File di toolbar lalu pilih PDF Anda. Mesin membaca PDF berbasis teks (yang diekspor dari Word, LaTeX, InDesign, atau peramban apa pun).
Pilih dari 5.000+ suara di 146 bahasa. Sesuaikan kecepatan dan nada, atau pilih aksen tertentu. Dengarkan pratinjau sebelum memulai.
Audio siap dalam waktu kurang dari satu menit untuk dokumen pendek, beberapa menit untuk buku utuh. Putar langsung di akun Anda atau unduh berkas MP3-nya.
Empat alur kerja nyata yang kami lihat setiap hari. Ketuk kartu untuk mendengarkan — mesin yang sama, dokumen Anda langsung masuk ke editor di atas.
Paper IEEE 12 halaman, draf disertasi, catatan kuliah dari arXiv — dengarkan dalam perjalanan alih-alih membacanya di layar. Tata letak multikolom dan catatan kaki diratakan otomatis sebelum narasi.
PDF buku utuh dalam bahasa apa pun — novel terbitan Gramedia, kumpulan cerita Pramoedya, fiksi sastra berbahasa Inggris. Karakter narator tetap konsisten ratusan halaman, tanpa penurunan kualitas pada bab dua belas.
Laporan kuartalan, riset pasar, memo direksi — ubah deck 40 halaman menjadi MP3 25 menit untuk didengarkan saat di KRL atau MRT. Iapetus memberi pembacaan korporat yang bersih tanpa terdengar seperti robot.
Esai majalah, longread Substack, investigasi Tempo atau Kompas yang diekspor ke PDF — ubah bacaan 30 menit menjadi podcast yang bisa Anda dengarkan sambil memasak. Achernar ID punya warna suara hangat khas narator majalah.
Alat profesional untuk buku utuh:
gunakan <cut> tag untuk memecah novel 300 halaman menjadi MP3 per bab dalam satu kali sintesis,
<dialog> tag untuk memberikan suara berbeda kepada setiap karakter pada bagian dialog,
dan <break> tag untuk jeda dramatis yang presisi antar adegan. Setiap tag punya panduan singkatnya sendiri.
Tiga hal yang dikerjakan alat ini lebih baik daripada sekadar menyalin teks mentah ke mesin TTS biasa.
Makalah dua kolom, daftar bullet, judul dan keterangan, catatan kaki — alur teks disusun ulang dengan menyadari struktur halaman. Urutan baca mengikuti halaman, bukan loncat antar kolom secara acak. Header, footer, dan nomor halaman disaring agar pembaca pdf dengan suara tidak mengucap "halaman tujuh belas" setiap menit.
Paper 30 halaman selesai dalam waktu kurang dari satu menit. Buku 200 halaman tuntas dalam 3–5 menit. Tidak perlu memecah berkas secara manual atau memisah per bab — unggah sekali, dapatkan satu MP3 (atau dipisah jadi trek per bab via bookmark TOC bila PDF Anda memilikinya).
Dokumen yang mencampur dua atau tiga bahasa — makalah dengan abstrak Inggris dan isi Indonesia, kontrak bilingual, formulir keimigrasian — bahasanya dideteksi otomatis lalu dinarasikan dengan suara yang tepat di setiap bagian. Tidak perlu memisah berkas dulu.
Klik tombol File pada toolbar editor di bagian atas halaman ini, pilih PDF Anda, tentukan suara dan bahasa, lalu klik Konversi. MP3 masuk ke akun Anda dalam 30 detik untuk dokumen pendek dan beberapa menit untuk buku utuh. Tidak ada yang perlu diinstal.
Tidak — mesin hanya membaca PDF berbasis teks (yang diekspor dari Word, LaTeX, InDesign, atau peramban). Untuk PDF berbasis gambar (buku hasil scan, laporan kiriman faks, foto dokumen), jalankan dulu lewat alat OCR gratis mana pun — Adobe Acrobat, ABBYY FineReader, atau bahkan OCR bawaan Google Drive — agar piksel berubah menjadi PDF teks. Setelah itu unggah seperti biasa.
Ya. Header dan footer berulang serta nomor halaman yang berdiri sendiri akan disaring, supaya pembaca tidak mengucap "halaman tujuh belas" setiap menit. Judul bab dan judul bagian tetap dipertahankan dan dibacakan dengan tempo natural.
Tabel diratakan baris demi baris, dengan judul kolom dibacakan sekali sebelum tiap baris. Keterangan gambar atau diagram dibacakan tepat di posisi kemunculannya. Catatan kaki dilewati dari alur utama dan dibacakan di akhir setiap bab agar tidak memutus ritme kalimat.
Tidak — berkas yang dilindungi DRM atau dikunci kata sandi akan ditolak saat unggah karena alasan hukum dan keamanan. Hapus sandinya dahulu (alat PDF apa pun bisa, asalkan Anda tahu sandinya), lalu unggah. Kami tidak mem-bypass DRM.
100 halaman selesai sekitar 2 menit (kurang lebih 3 jam audio MP3 pada kecepatan normal). Buku 500 halaman melampaui batas unggah 50 MB — pecah dulu jadi 2–3 bagian dengan alat PDF apa pun, konversi tiap bagian, kemudian gabungkan MP3-nya bila Anda ingin satu berkas saja.
Bisa — keduanya sudah tersedia. Bungkus pemisah bab dengan tag <cut> dan satu kali sintesis menghasilkan MP3 terpisah per bab. Untuk dialog antar karakter, tag <dialog> menyuarakan setiap karakter dengan aktor berbeda dalam satu berkas audio. Padukan keduanya untuk audiobook multi-suara penuh.
PDF hanyalah salah satu titik mulai. Akun SpeechGen yang sama berlaku untuk alat-alat berikut.
Konversi berkas .doc, .docx, dan .rtf. Bahasa, suara, dan kecepatan yang sama. → Buka
Unggah 20 detik, dapatkan suara pribadi yang membaca PDF dan dokumen Word dengan suara Anda sendiri. 15 bahasa.→ Buka
Ketik atau tempel teks apa pun. Sesuaikan kecepatan, nada, emosi, dan bahasa. 5.000+ suara tersedia. → Buka
Klik File di editor pada bagian atas halaman ini. 3.000 karakter pertama gratis — sekitar 5 halaman audio, tanpa kartu. Setelah itu mulai $5.
Konversi PDF ke MP3