งานวิจัยและวิทยานิพนธ์
เปเปอร์ IEEE ความยาวสิบสองหน้า ดราฟต์วิทยานิพนธ์ บันทึกบรรยายจาก arXiv — ฟังบนรถไฟฟ้าระหว่างเดินทางแทนการกวาดสายตาบนหน้าจอ ระบบจะปรับโครงสร้างหลายคอลัมน์และเชิงอรรถให้เรียบก่อนเริ่มอ่านโดยอัตโนมัติ
เปิดเอดิเตอร์ด้านบน คลิก File บนแถบเครื่องมือเพื่ออัปโหลดไฟล์ของคุณ แล้วรับ MP3 เสียงธรรมชาติภายในไม่กี่วินาที — ทั้งงานวิจัย หนังสืออิเล็กทรอนิกส์ บทความขนาดยาว และรายงานธุรกิจ SpeechGen อ่าน PDF ออกเสียงได้ใน 146 ภาษา ด้วยเอนจินเดียวกับที่ขับเคลื่อนเสียงสำเร็จรูปกว่า 5,000 เสียงของเรา ไม่ต้องติดตั้งโปรแกรม ไม่ต้องสมัครสมาชิกสำหรับ 3,000 ตัวอักษรแรก
ทำงานบนเบราว์เซอร์โดยไม่ต้องดาวน์โหลด เอกสารสั้นเสร็จในไม่กี่วินาที หนังสือทั้งเล่มเสร็จในไม่กี่นาที
ในเอดิเตอร์ด้านบน คลิกปุ่ม File บนแถบเครื่องมือ แล้วเลือกเอกสารของคุณ เอนจินอ่านได้เฉพาะไฟล์ที่มีข้อความ (ไฟล์ที่ส่งออกจาก Word, LaTeX, InDesign หรือเบราว์เซอร์ใดก็ได้)
เลือกได้จากเสียงกว่า 5,000 เสียงใน 146 ภาษา ปรับความเร็วและระดับเสียง หรือเลือกสำเนียงที่ต้องการ ฟังตัวอย่างก่อนตัดสินใจได้เสมอ
เอกสารสั้นได้ไฟล์เสียงในไม่ถึงหนึ่งนาที หนังสือทั้งเล่มเพียงไม่กี่นาที สตรีมในบัญชีของคุณหรือดาวน์โหลดเป็น MP3 ก็ได้
สี่กรณีการใช้งานจริงที่เราเห็นทุกวัน แตะการ์ดเพื่อฟัง — เอนจินเดียวกัน อัปโหลดไฟล์ของคุณตรงเข้าเอดิเตอร์ด้านบนได้เลย
เปเปอร์ IEEE ความยาวสิบสองหน้า ดราฟต์วิทยานิพนธ์ บันทึกบรรยายจาก arXiv — ฟังบนรถไฟฟ้าระหว่างเดินทางแทนการกวาดสายตาบนหน้าจอ ระบบจะปรับโครงสร้างหลายคอลัมน์และเชิงอรรถให้เรียบก่อนเริ่มอ่านโดยอัตโนมัติ
หนังสือฉบับเต็มในทุกภาษา — นวนิยายไทยร่วมสมัย วรรณกรรมแปลภาษาอังกฤษ ทริลเลอร์สเปน เสียงผู้บรรยายคงเส้นคงวาตลอดหลายร้อยหน้า ไม่มีคุณภาพตกในบทที่สิบสอง
รายงานรายไตรมาส งานวิจัยตลาด บันทึกของคณะกรรมการ — เปลี่ยนสไลด์ 40 หน้าให้เป็น MP3 ความยาว 25 นาทีไว้ฟังบนรถไฟฟ้า Iapetus ให้น้ำเสียงแบบมืออาชีพที่สะอาดตา ไม่เหมือนหุ่นยนต์
เรียงความนิตยสาร longread จาก Substack สารคดีเชิงลึกของหนังสือพิมพ์ที่ส่งออกเป็น PDF — เปลี่ยนการอ่าน 30 นาทีให้กลายเป็นพอดแคสต์ที่ฟังได้ขณะทำกับข้าว Achernar TH ให้น้ำเสียงอบอุ่นแบบนักจัดรายการนิตยสาร
เครื่องมือมืออาชีพสำหรับหนังสือเล่มยาว:
ใช้แท็ก <cut> เพื่อแบ่งนวนิยาย 300 หน้าเป็น MP3 รายบทในการสังเคราะห์เพียงครั้งเดียว
ใช้แท็ก <dialog> เพื่อให้แต่ละตัวละครมีเสียงต่างกันในบทสนทนา
และใช้แท็ก <break> เพื่อสร้างจังหวะหยุดที่แม่นยำระหว่างฉาก แต่ละแท็กมีคู่มือสั้น ๆ ให้อ่าน
สามสิ่งที่เครื่องมือนี้ทำได้ดีกว่าการคัดลอกข้อความล้วน ๆ ไปวางในเอนจิน TTS ทั่วไป
งานวิจัยสองคอลัมน์ รายการแบบบุลเล็ต หัวเรื่องและคำบรรยายภาพ เชิงอรรถ — การจัดเรียงข้อความเข้าใจโครงสร้างของเอกสาร ลำดับการอ่านตรงกับหน้ากระดาษจริง ไม่กระโดดไปมาระหว่างคอลัมน์ หัวกระดาษ ท้ายกระดาษ และเลขหน้าจะถูกกรองออก เพื่อไม่ให้ผู้บรรยายพูดคำว่า "หน้าสิบเจ็ด" ทุกนาที
เปเปอร์ 30 หน้าเสร็จในไม่ถึงหนึ่งนาที หนังสือ 200 หน้าเสร็จใน 3–5 นาที ไม่ต้องตัดเป็นส่วน ไม่ต้องแบ่งบทเอง — อัปโหลดครั้งเดียวได้ MP3 ไฟล์เดียว (หรือแยกตามบทผ่านที่คั่นในสารบัญ ถ้าเอกสารมี TOC)
เอกสารที่มีสองหรือสามภาษาผสมกัน — งานวิจัยที่มีบทคัดย่อภาษาอังกฤษและเนื้อหาภาษาไทย สัญญาสองภาษา แบบฟอร์มตรวจคนเข้าเมือง — ระบบจะตรวจจับภาษาและบรรยายด้วยเสียงที่เหมาะกับแต่ละส่วน ไม่ต้องแยกไฟล์ก่อน
คลิกปุ่ม File บนแถบเอดิเตอร์ที่ด้านบนของหน้านี้ เลือกเอกสารของคุณ เลือกเสียงและภาษา แล้วกด Convert ไฟล์ MP3 จะเข้าบัญชีของคุณภายใน 30 วินาทีสำหรับเอกสารสั้น และไม่กี่นาทีสำหรับหนังสือทั้งเล่ม ไม่ต้องติดตั้งโปรแกรมใด ๆ
ไม่รองรับโดยตรง — เอนจินอ่านเฉพาะเอกสารแบบข้อความเท่านั้น (ไฟล์ที่ส่งออกจาก Word, LaTeX, InDesign หรือเบราว์เซอร์ใดก็ได้) สำหรับเอกสารที่เป็นภาพ (หนังสือสแกน รายงานที่แฟกซ์มา หรือภาพถ่ายเอกสาร) ให้ผ่านเครื่องมือ OCR ฟรีก่อน เช่น Adobe Acrobat, ABBYY FineReader หรือ OCR ในตัวของ Google Drive เพื่อแปลงพิกเซลให้เป็นข้อความ จากนั้นจึงอัปโหลดที่นี่ตามปกติ
ใช่ค่ะ หัวกระดาษและท้ายกระดาษที่วนซ้ำ รวมถึงเลขหน้าโดด ๆ จะถูกกรองออกเพื่อไม่ให้ผู้บรรยายพูดคำว่า "หน้าสิบเจ็ด" ทุกนาที ส่วนชื่อบทและหัวเรื่องของแต่ละส่วนยังคงอยู่และจะถูกอ่านในจังหวะที่เป็นธรรมชาติ
ตารางจะถูกแปลงเป็นแถวเรียงต่อเนื่อง โดยอ่านหัวคอลัมน์หนึ่งครั้งก่อนแถวข้อมูลแต่ละแถว คำบรรยายของรูปและกราฟจะถูกอ่าน ณ ตำแหน่งที่ปรากฏ ส่วนเชิงอรรถจะข้ามจากเนื้อหาหลักและอ่านท้ายบท เพื่อไม่ให้กระทบจังหวะของประโยค
ไม่ได้ค่ะ — ไฟล์ที่มี DRM และไฟล์ที่ล็อกด้วยรหัสผ่านจะถูกปฏิเสธตอนอัปโหลด ด้วยเหตุผลทางกฎหมายและความปลอดภัย กรุณาเอารหัสผ่านออกก่อน (เครื่องมือจัดการ PDF ทั่วไปทำได้ถ้าคุณรู้รหัส) จากนั้นจึงอัปโหลด ระบบของเราไม่ข้าม DRM
100 หน้าใช้เวลาประมาณ 2 นาที (ได้ไฟล์เสียงประมาณ 3 ชั่วโมงที่ความเร็วปกติ) สำหรับหนังสือ 500 หน้าจะเกินขีดจำกัดอัปโหลด 50 MB กรุณาแบ่งเป็น 2–3 ส่วนด้วยเครื่องมือใด ๆ แปลงทีละส่วน แล้วต่อไฟล์ MP3 ภายหลังหากต้องการไฟล์เดียว
PDF เป็นแค่จุดเริ่มต้นเดียว ใช้บัญชี SpeechGen เดียวกันกับเครื่องมือเหล่านี้ได้เลย
แปลงไฟล์ .doc, .docx และ .rtf ภาษาเดิม เสียงเดิม ความเร็วเดิม → เปิด
อัปโหลดเสียงเพียง 20 วินาที ได้เสียงส่วนตัวที่อ่าน PDF และเอกสาร Word เป็นเสียงคุณเอง รองรับ 15 ภาษา→ เปิด
พิมพ์หรือวางข้อความใด ๆ ปรับความเร็ว ระดับเสียง อารมณ์ และภาษา มีเสียงให้เลือกกว่า 5,000 เสียง → เปิด
คลิก File ในเอดิเตอร์ที่ด้านบนของหน้า 3,000 ตัวอักษรแรกฟรี — ราว 5 หน้าเสียง ไม่ต้องผูกบัตร หลังจากนั้นเริ่มต้นที่ 5 ดอลลาร์
แปลง PDF เป็น MP3