קוד שפה: zh-CN-henan
SpeechGen תומך בדיאלקט Zhongyuan Mandarin Henan (zh-CN-henan), גרסה לשונית רווחת שנמצאת בעיקר באזור המישור המרכזי (Zhongyuan), כולל מחוז הנאן בסין. השפה המכונה לחילופין הנאנית, היא גרסה של מנדרינית וחבר מפתח במשפחת השפות הסינית.
ניב זה, המכונה גם גרסה מסוימת, הוא גרסה של מנדרינית וחלק בלתי נפרד מקבוצת השפה הסינית.
לגרסה המנדרינית הזו יש תכונות פונטיות ייחודיות. המערכת הטונאלית שלו מורכבת, ומעצימה את העושר השמיעתי של הדיבור. כמו צורות מנדריניות אחרות, לניב המישורים המרכזי הזה יש ארבעה גוונים. עם זאת, למימוש הצלילים הללו עשויות להיות שינויים קלים בהתאם למיקום הגיאוגרפי ולרמקולים בודדים.
הפלטפורמה שלנו נותנת עדיפות לשימור המאפיינים הללו בהקשר של טקסט לדיבור. הדגש של SpeechGen הוא על רפרודוקציה מדויקת של צלילים, שמירת הגייה נכונה וטיפול בדפוסי הניסוח הייחודיים של הניב הספציפי מאזור המישורים המרכזיים.
הניב כולל מגוון של צלילי עיצור ראשוניים, הכוללים עצירות לא נשאבות (כמו /p/, /t/, /k/) ועצירות שאיפות (כמו /pʰ/, /tʰ/, /kʰ/). הגרסה המנדרינית הזו שמרה גם על כמה עיצורים אחרונים, במיוחד אלו כמו /n/ ו /ŋ/.
SpeechGen ממנפת טכניקות בינה מלאכותית מתקדמות כדי לשמור על הדקויות הלשוניות של הניב הספציפי הזה ללא פגע. המערכת מחשיבה את ההקשר כדי להבדיל בין הומפונים, מיישמת את הווריאציות הטונאליות המדויקות, ומצייתת לכללי התחביר של הניב הספציפי מאזור מזרח אסיה.