07-09-2025 , 16-09-2025
เปิดรายการภาษาที่รองรับและเลือกภาษาของข้อความของคุณ ภาษาที่รองรับ: มากกว่า 150 ภาษา (คลังเสียง AI)
หลังจากเลือกภาษาแล้ว รายการเสียงจะปรากฏขึ้น ฟังตัวอย่างและเลือกเสียงที่คุณชอบ
คัดลอกข้อความของคุณลงในช่องข้อความ หรืออัปโหลดไฟล์ (DOCX, PDF) สำหรับการแปลงคำบรรยายเป็นเสียงพูด ให้ใช้หน้า SRT to voice โดยเฉพาะ
รอการประมวลผลและดาวน์โหลดไฟล์เสียงของคุณ
เสร็จแล้ว! เสียงพากย์แรกของคุณพร้อมใช้งานในเวลาเพียงไม่กี่นาที
💡 เคล็ดลับ: เมื่อคัดลอกมาจากไฟล์ PDF ให้ใส่ใจกับข้อความเป็นพิเศษ — อาจมีอักขระที่มองไม่เห็นปรากฏขึ้นซึ่งจะทำให้เสียงเสียหายได้!
สูงสุดต่อการสร้าง: 2,000,000 ตัวอักษร (≈ 285,000-330,000 คำ) — นี่คือปริมาณข้อความที่น่าประทับใจที่คุณสามารถแปลงเป็นเสียงพูดได้ในการสร้างครั้งเดียว ทำให้เหมาะสำหรับเนื้อหาขนาดยาว เช่น หนังสือทั้งเล่ม หรือเอกสารจำนวนมาก
⚠️ สำคัญ: เลือกภาษาที่ถูกต้องสำหรับข้อความของคุณก่อน
หลังจากเลือกภาษาแล้ว รายการเสียงที่มีอยู่จะเปิดขึ้น ฟังตัวอย่างโดยคลิกปุ่มเล่นสำหรับแต่ละเสียงเพื่อค้นหาเสียงที่เหมาะสมกับความต้องการของคุณที่สุด คุณจะเห็นประเภทเสียงต่างๆ ที่มีให้เลือก: เสียงปกติให้คุณภาพมาตรฐาน เสียง PRO ให้คุณภาพและความเป็นธรรมชาติที่ดีขึ้น และเสียงหลายภาษา (มีรหัสภาษา เช่น Ava_US, Ava_ES) ช่วยให้คุณรักษาความสม่ำเสมอของเสียงในภาษาต่างๆ ได้ ใช้เวลาในการฟังตัวอย่างแต่ละเสียง เนื่องจากมีความแตกต่างกันอย่างมากในเรื่องน้ำเสียง อารมณ์ และลักษณะเฉพาะ
ใต้ช่องข้อความ เหนือปุ่มสร้าง คุณสามารถปรับการตั้งค่าการหยุดชั่วคราวได้:
คลิกปุ่ม "สร้างเสียงพูด" ใต้ช่องข้อความเพื่อเริ่มกระบวนการแปลง เวลาในการประมวลผลขึ้นอยู่กับความยาวของข้อความของคุณ — ข้อความสั้นๆ จะเสร็จสิ้นในไม่กี่วินาที ในขณะที่เอกสารขนาดยาวอาจใช้เวลาสองสามนาที เมื่อการสร้างเสร็จสมบูรณ์ คุณจะสามารถฟังผลลัพธ์ได้โดยตรงในเบราว์เซอร์เพื่อให้แน่ใจว่าเป็นไปตามที่คุณคาดหวัง
หลังจากสร้างเสร็จแล้ว ปุ่ม "ดาวน์โหลด" จะปรากฏขึ้น โดยค่าเริ่มต้น คุณสามารถดาวน์โหลดไฟล์เป็น MP3 ได้ อย่างไรก็ตาม หากคุณต้องการรูปแบบอื่น (WAV หรือ OPUS) หรือต้องการเปลี่ยนคุณภาพเสียง (อัตราตัวอย่างตั้งแต่ 8000 ถึง 44000 Hz) คุณจะต้องเลือกตัวเลือกเหล่านี้จากเมนูแบบเลื่อนลงก่อน สร้างเสียงพูดใหม่ด้วยการตั้งค่าที่คุณเลือก แล้วดาวน์โหลดไฟล์ตามข้อกำหนดที่คุณต้องการ
มาตราส่วนความเร็ว:
มาตราส่วนนี้ทำงานอย่างไร: ค่าที่เป็นเศษส่วนน้อยกว่า 1 จะทำให้การพูดช้าลง ค่าที่มากกว่า 1 จะทำให้เร็วขึ้น สิ่งนี้ช่วยให้สามารถเลือกจังหวะที่แม่นยำสำหรับผู้ชมของคุณ
คำแนะนำความเร็ว:
ช่วงระดับเสียง: ตั้งแต่ -20 ถึง +20 โดยมีขั้นละ 2
เหตุผลที่ต้องมีขั้นละ 2: ขั้นละ 2 หน่วยทำให้ระดับเสียงเปลี่ยนแปลงได้อย่างชัดเจนแต่ไม่ฉับพลัน ขั้นที่เล็กกว่าจะสังเกตได้ยาก ขั้นที่ใหญ่กว่าจะดูเกินจริง
อิทธิพลของระดับเสียง:
การใช้งาน:
การหยุดชั่วคราวระหว่างประโยค: 300ms (ค่าเริ่มต้น)
การหยุดชั่วคราวระหว่างย่อหน้า: 400ms (ค่าเริ่มต้น)
การตั้งค่าเหล่านี้สามารถเปลี่ยนแปลงได้ในเมนูแบบเลื่อนลงตั้งแต่ 150ms ถึง 30 วินาที
ผ่านอินเทอร์เฟซ:
ผ่านแท็ก:
แทรกแท็ก <break time="200ms"/> หรือ <break time="2s"/> ในตำแหน่งที่ต้องการ
กฎการหยุดชั่วคราว:
เมื่อใดควรใช้การหยุดชั่วคราว:
ฟังก์ชัน บทสนทนา ช่วยให้สามารถใช้เสียงต่างๆ ในข้อความเดียวได้
ฟีเจอร์บทสนทนาหลายเสียงเปิดโอกาสในการสร้างสรรค์ที่นอกเหนือไปจากแค่เสียงตัวละคร ตัวอย่างเช่น ครูสอนภาษาต่างประเทศสามารถใช้ฟังก์ชันนี้เพื่อสาธิตวลีเดียวกันด้วยความเร็วที่แตกต่างกันสำหรับการเรียนรู้ภาษา ช่วยให้นักเรียนเข้าใจการออกเสียงในระดับความเข้าใจที่แตกต่างกัน สำหรับเทคนิคโดยละเอียดและการใช้งานในห้องเรียน โปรดดูคู่มือของเราเกี่ยวกับการ ใช้ text-to-speech สำหรับการสอนภาษาต่างประเทศ
เสียงที่มีรหัสภาษา (เช่น Ava_US, Ava_ES, Ava_DE) ถูกออกแบบมาเพื่อรักษาการรับรู้เสียงที่สม่ำเสมอในภาษาต่างๆ เสียงหลายภาษานี้ช่วยให้คุณสร้างสไตล์ที่เป็นหนึ่งเดียวสำหรับเนื้อหาหลายภาษา ทำให้มั่นใจได้ว่าตัวละครเสียงเดียวกันสามารถพูดได้หลายภาษาอย่างราบรื่น คุณสมบัตินี้มีประโยชน์อย่างยิ่งในโหมดบทสนทนา ซึ่งคุณสามารถสลับไปมาระหว่างภาษาต่างๆ ได้ โดยยังคงรักษาบุคลิกเสียงที่จดจำได้ตลอดโปรเจกต์เสียงของคุณ
SpeechGen ช่วยให้คุณแบ่งเสียงที่สร้างขึ้นออกเป็นหลายส่วนภายในโปรเจกต์การสังเคราะห์เดียว ทำให้เหมาะสำหรับโปรแกรมตัดต่อวิดีโอที่ต้องการไฟล์เสียงแยกต่างหากสำหรับฉากหรือบทต่างๆ คุณสมบัตินี้มีประโยชน์อย่างยิ่งสำหรับการสร้างเสียงพากย์สำหรับวิดีโอ YouTube คอร์สออนไลน์ หรือโปรเจกต์ใดๆ ที่ต้องการการซิงโครไนซ์เสียงที่แม่นยำ
ในการแบ่งเสียงของคุณ เพียงวางเคอร์เซอร์ของคุณในตำแหน่งที่คุณต้องการแบ่งข้อความและคลิกปุ่มตัดในแผงเมนู สิ่งนี้จะแทรกแท็ก <cut/> ณ ตำแหน่งนั้น คุณยังสามารถพิมพ์หรือคัดลอกและวางแท็กนี้ด้วยตนเองตลอดทั้งข้อความของคุณ สำหรับชื่อไฟล์ที่กำหนดเอง ให้ใช้รูปแบบนี้:
<cut name="your-filename"/>
คุณสมบัตินี้ช่วยให้คุณจัดระเบียบส่วนต่างๆ ด้วยชื่อที่มีความหมาย เช่น:
<cut name="intro"/>
<cut name="chapter-1"/>
เมื่อคุณเพิ่มแท็กส่วนอย่างน้อยหนึ่งแท็ก ปุ่ม "ดาวน์โหลดส่วนต่างๆ" จะปรากฏขึ้นหลังจากการสร้าง คลิกเพื่อดาวน์โหลดส่วนทั้งหมดพร้อมกัน หรือใช้ปุ่ม "เพิ่มเติม" บนเครื่องเล่นเสียงเพื่อเข้าถึงส่วนต่างๆ แต่ละไฟล์จะถูกตั้งชื่อโดยอัตโนมัติด้วย ID ที่ไม่ซ้ำกัน หมายเลขลำดับ และชื่อที่สื่อความหมาย (เช่น "7054789_1_first-sentence") ทำให้ง่ายต่อการระบุและจัดระเบียบไฟล์เสียงของคุณในซอฟต์แวร์ตัดต่อของคุณ
สำหรับโปรเจกต์ที่ใหญ่ขึ้น ให้แบ่งออกเป็นการสร้างหลายครั้ง สำหรับคำแนะนำที่ครอบคลุม เทคนิคขั้นสูง และบทแนะนำวิดีโอ โปรดไปที่ เอกสารประกอบการแบ่งส่วนเสียงฉบับสมบูรณ์ ของเรา
บางเสียงมี กราฟการออกเสียง:
กราฟการออกเสียงมีให้สำหรับเสียงที่มีไอคอน การตั้งค่า ปรากฏถัดจากชื่อเสียง — คุณสมบัตินี้พบได้ในเสียงมากกว่าครึ่งหนึ่งในคลังเสียง รวมถึงตัวเลือกปกติและ PRO
เลือกประโยคที่คุณต้องการปรับการออกเสียง แล้วกดปุ่ม การออกเสียง อินเทอร์เฟซนี้จะปรากฏขึ้น
SpeechGen ใช้ ระบบแคชอัจฉริยะ ที่ช่วยประหยัดโควต้าของคุณได้อย่างมาก ระบบทำงานโดยการบันทึกแต่ละประโยค (สูงสุด 100,000 ตัวอักษร) ในแคชเป็นเวลา 7 วัน เมื่อคุณสร้างเสียงพูดใหม่ ประโยคที่ไม่มีการเปลี่ยนแปลงจะถูกดึงมาจากแคชโดยอัตโนมัติโดยไม่มีค่าใช้จ่าย — คุณจะจ่ายเฉพาะประโยคใหม่หรือที่แก้ไขเท่านั้น ซึ่งหมายความว่าคุณสามารถแก้ไขข้อความของคุณทีละน้อยได้โดยไม่ต้องใช้โควต้าตัวอักษรทั้งหมดของคุณในแต่ละครั้ง ประวัติโปรเจกต์จะถูกเก็บไว้เป็นเวลา 30 วัน และไฟล์ที่คุณเพิ่มในรายการโปรดจะถูกเก็บไว้ถาวร
ระยะเวลาการจัดเก็บ:
เสียงฟังดูไม่เป็นธรรมชาติ:
การออกเสียงผิด:
การหยุดชั่วคราวไม่เป็นธรรมชาติ:
ข้อผิดพลาด SSML:
สำหรับการ ควบคุมเสียงขั้นสูง ใช้แท็ก SSML:
⚠️ ข้อควรระวัง: เสียงต่างๆ รองรับชุดแท็ก SSML ที่แตกต่างกัน ทดสอบฟังก์ชันสำหรับแต่ละเสียงโดยเฉพาะ
API มีให้นักพัฒนา เพื่อผสานรวม SpeechGen.io เข้ากับแอปพลิเคชันและบริการของตนเอง
ก่อนอื่น ตรวจสอบว่าไฟล์ของคุณอยู่ในรูปแบบที่รองรับ (DOCX, PDF หรือ TXT) ตรวจสอบให้แน่ใจว่าไฟล์ไม่เสียหายและลองอัปโหลดอีกครั้ง หากปัญหายังคงอยู่ ให้คัดลอกข้อความด้วยตนเองและวางลงในช่องข้อความโดยตรง นอกจากนี้ ให้ตรวจสอบว่าขนาดไฟล์ของคุณไม่เกินขีดจำกัดของแพลตฟอร์ม
ประวัติโปรเจกต์ของคุณจะถูกบันทึกโดยอัตโนมัติเป็นเวลา 30 วัน แคชอัจฉริยะ (สำหรับการบันทึกระดับประโยค) จะมีอายุ 7 วัน หากต้องการเก็บไฟล์ไว้ถาวร ให้เพิ่มไฟล์เหล่านั้นในรายการโปรดของคุณ สิ่งนี้จะช่วยให้มั่นใจได้ว่าโปรเจกต์เสียงที่สำคัญของคุณจะไม่สูญหายและยังคงเข้าถึงได้ในโปรไฟล์ของคุณ
ได้! SpeechGen มีการสร้างเสียงหลายเสียง (โหมดบทสนทนา) คุณสามารถกำหนดเสียงที่แตกต่างกันให้กับส่วนข้อความที่แตกต่างกัน ทำให้เหมาะสำหรับหนังสือเสียงที่มีตัวละครหลายตัว บทสนทนาเพื่อการศึกษา หรือพอดคาสต์ที่มีผู้บรรยายหลายคน คุณยังสามารถใช้เสียงหลายภาษาเพื่อสลับไปมาระหว่างภาษาต่างๆ ได้ โดยยังคงรักษาความสม่ำเสมอของตัวละคร
เสียง PRO ให้คุณภาพและความเป็นธรรมชาติที่เหนือกว่าเมื่อเทียบกับเสียงปกติ โดยทั่วไปแล้วจะมีอารมณ์ที่ดีขึ้น การออกเสียงที่แม่นยำยิ่งขึ้น และบางเสียงรองรับคุณสมบัติขั้นสูง เช่น กราฟการออกเสียง สำหรับโปรเจกต์ระดับมืออาชีพ เช่น หนังสือเสียง คอร์ส หรือการนำเสนอทางธุรกิจ ขอแนะนำให้ใช้เสียง PRO
ขึ้นอยู่กับการตั้งค่าที่คุณเปลี่ยนแปลง การปรับความเร็วหรือระดับเสียงในการพูดต้องมีการสร้างใหม่ทั้งหมดและจะใช้โควต้าตัวอักษรของคุณ เนื่องจาก การเปลี่ยนแปลงเหล่านี้ส่งผลต่อการสังเคราะห์เสียงทั้งหมด อย่างไรก็ตาม คุณสามารถปรับการหยุดชั่วคราวระหว่างประโยคและย่อหน้าได้อย่างอิสระโดยไม่มีการใช้โควต้าใดๆ นอกจากนี้ SpeechGen ยังใช้การแคชอัจฉริยะ: หากคุณสร้างข้อความขนาดใหญ่ จากนั้นแก้ไขเพียงประโยคเดียวและสร้างใหม่ ระบบจะคิดค่าบริการเฉพาะประโยคที่เปลี่ยนแปลงนั้นเท่านั้น ไม่ใช่ข้อความทั้งหมด ระบบแคชนี้จะบันทึกประโยคที่คุณไม่ได้เปลี่ยนแปลงไว้เป็นเวลา 7 วัน ทำให้การแก้ไขแบบซ้ำๆ ประหยัดค่าใช้จ่ายมาก
รับความช่วยเหลือจากชุมชนของเรา! ถามคำถามของคุณในกลุ่ม Telegram ของเรา: https://t.me/speechgen