كيفية استخدام تحويل النص إلى كلام على SpeechGen.io: دليل كامل

07-09-2025 , 16-09-2025

🚀 البدء السريع — إنشاء صوت في 4 خطوات

الخطوة 1: اختيار اللغة

افتح قائمة اللغات المنسدلة واختر لغة النص الخاص بك. اللغات المدعومة: أكثر من 150 لغة (مكتبة أصوات الذكاء الاصطناعي).

الخطوة 2: اختيار الصوت

بعد اختيار اللغة، ستظهر قائمة بالأصوات. استمع إلى العينات واختر صوتك المفضل.

الخطوة 3: لصق النص

انسخ نصك إلى مربع النص أو قم بتحميل ملف (DOCX، PDF). لتحويل الترجمات المصاحبة إلى كلام، استخدم صفحة SRT إلى صوت المخصصة.

الخطوة 4: انقر على "إنشاء كلام" (الزر الأزرق)

الخطوة 4: انقر على إنشاء كلام

انتظر حتى تتم المعالجة وقم بتنزيل ملف الصوت الجاهز.

هذا كل شيء! تعليقك الصوتي الأول جاهز في غضون دقيقتين فقط.

إعداد النص

موصى به:

استخدم نصًا عاديًا بدون رموز غير ضرورية.
ضع علامات الترقيم بشكل صحيح (نقاط، فواصل، علامات تعجب).
قسم النص الطويل إلى فقرات.

تجنب:

الرموز التعبيرية والوجوه التعبيرية (قد تعطل إنشاء الصوت).
الرموز الغريبة: ✓، ★، ♦، ►، ♪، ©، ™، ®، ∞، •، ◦، ▪، ▫
رموز Unicode الخاصة:

💡 نصيحة: عند النسخ من ملفات PDF، انتبه جيدًا للنص — قد تظهر أحرف غير مرئية يمكن أن تفسد الصوت!

الحدود والقيود

اللغات المدعومة: 150+ لغة (القائمة الكاملة).
تنسيقات التحميل: نص عادي، DOCX، PDF، SRT.

الحد الأقصى لكل عملية إنشاء: 2,000,000 حرف (حوالي 285,000-330,000 كلمة) - هذه كمية رائعة من النص يمكنك تحويلها إلى كلام في عملية إنشاء واحدة، مما يجعلها مثالية للمحتوى الطويل مثل الكتب الكاملة أو الوثائق الشاملة.

تعليمات مفصلة خطوة بخطوة

الخطوة 1: تحميل النص

لصق النص: انسخ نصك إلى مربع النص.
تحميل الملف: أو انقر فوق زر التحميل وحدد ملفًا (DOCX، PDF).
التحقق من النص: تأكد من عرض النص بشكل صحيح.

الخطوة 2: اختيار اللغة

⚠️ هام: اختر اللغة الصحيحة لنصك أولاً.

افتح قائمة اللغات المنسدلة.
ابحث عن اللغة المطلوبة (أكثر من 150 لغة متاحة).
للنصوص متعددة اللغات، استخدم إنشاء صوت متعدد اللغات.

الخطوة 3: اختيار الصوت

بعد اختيار اللغة، ستفتح قائمة بالأصوات المتاحة. استمع إلى العينات بالنقر على زر التشغيل لكل صوت للعثور على الصوت الذي يناسب احتياجاتك. سترى أنواعًا مختلفة من الأصوات المتاحة: الأصوات العادية تقدم جودة قياسية، والأصوات الاحترافية (PRO) تقدم جودة محسنة وطبيعية، والأصوات متعددة اللغات (مميزة برموز لغات مثل Ava_US، Ava_ES) تسمح لك بالحفاظ على تناسق الصوت عبر لغات مختلفة. خذ وقتك لمعاينة كل صوت لأنها تختلف بشكل كبير في النبرة والعاطفة والشخصية.

الخطوة 4: تكوين المعلمات

سرعة الكلام: من x0.1 (بطيء جدًا) إلى x2.2 (سريع جدًا).
طبقة الصوت: من -20 إلى +20 (بزيادة 2).

أسفل مربع النص، فوق زر الإنشاء، يمكنك ضبط إعدادات الوقفات:

إعدادات الوقفات

الوقفات بين الجمل: 150 مللي ثانية - 30 ثانية.
الوقفات بين الفقرات: 150 مللي ثانية - 30 ثانية.

الخطوة 5: إنشاء الكلام

انقر فوق زر "إنشاء كلام" أسفل مربع النص لبدء عملية التحويل. يعتمد وقت المعالجة على طول النص الخاص بك - النصوص الأقصر تكتمل في ثوانٍ بينما قد تستغرق المستندات الأطول بضع دقائق. بمجرد اكتمال الإنشاء، ستتمكن من الاستماع إلى النتيجة مباشرة في المتصفح للتأكد من أنها تلبي توقعاتك.

الخطوة 6: التنزيل

بعد اكتمال الإنشاء، سيظهر زر "تنزيل". افتراضيًا، يمكنك ببساطة تنزيل الملف بصيغة MP3. ومع ذلك، إذا كنت بحاجة إلى تنسيق مختلف (WAV أو OPUS) أو ترغب في تغيير جودة الصوت (معدل العينة من 8000 إلى 44000 هرتز)، فستحتاج أولاً إلى تحديد هذه الخيارات من القوائم المنسدلة، وإعادة إنشاء الكلام بالإعدادات التي اخترتها، ثم تنزيل الملف بالمواصفات المفضلة لديك.

إعدادات معلمات الصوت

سرعة الكلام

مقياس السرعة:

x0.1 - x0.9: إبطاء (للمواد المعقدة، تعلم اللغات).
x1.0: السرعة العادية (افتراضي).
x1.1 - x2.2: تسريع (للمحتوى الديناميكي).

سبب هذا المقياس: القيم الكسرية الأقل من 1 تبطئ الكلام، والأكبر من 1 تسرعه. هذا يسمح باختيار دقيق للإيقاع لجمهورك.

توصيات السرعة:

التعليم: x0.8-x1.0 (لفهم أفضل).
العروض التقديمية: x0.9-x1.1 (وتيرة رسمية).
البودكاست: x1.0-x1.2 (وتيرة حيوية).
يوتيوب: x1.1-x1.4 (لجذب الانتباه).

طبقة الصوت

نطاق طبقة الصوت: من -20 إلى +20 بزيادة 2.

سبب الزيادة 2: زيادة بمقدار 2 وحدة توفر تغييرًا ملحوظًا ولكن ليس حادًا في طبقة الصوت. الزيادات الأصغر لن تكون ملحوظة، والزيادات الأكبر ستكون دراماتيكية للغاية.

تأثير طبقة الصوت:

القيم السالبة (-2 إلى -20): تجعل الصوت أعمق، وأكثر جدية، وسلطة.
القيم الموجبة (+2 إلى +20): تجعل الصوت أعلى، وأكثر ودية، وأكثر حيوية.
0: طبقة صوت محايدة (افتراضي).

التطبيقات:

محتوى الأعمال: -4 إلى +2.
محتوى الأطفال: +4 إلى +12.
محتوى درامي: -8 إلى -16.
محتوى ودود: +2 إلى +8.

العمل مع الوقفات

الوقفات التلقائية

الوقفات بين الجمل: 300 مللي ثانية (افتراضي).

الوقفات بين الفقرات: 400 مللي ثانية (افتراضي).

يمكن تغيير هذه الإعدادات في القوائم المنسدلة من 150 مللي ثانية إلى 30 ثانية.

إدراج وقفات يدوية

عبر الواجهة:

ضع المؤشر في الموقع المطلوب في النص.
انقر فوق زر "وقفة" في القائمة.
سيظهر الرمز .- في النص.

عبر العلامات:

أدخل العلامة <break time="200ms"/> أو <break time="2s"/> في الموقع المطلوب.

قواعد الوقفات:

الوقفة القصوى: 30 ثانية.
يمكن وضع وقفات متعددة متتالية لتأخير أطول.
الوقفات لا تستهلك حدودًا إضافية.

متى تستخدم الوقفات:

قبل العبارات المهمة.
بعد الأسئلة البلاغية.
بين المواضيع المختلفة.
لخلق تأثير درامي.

صوت متعدد

تسمح لك وظيفة الحوار باستخدام أصوات مختلفة في نص واحد.

التطبيقات:

كتب صوتية: أصوات مختلفة للشخصيات.
حوارات تعليمية: معلم وطالب.
عروض تقديمية: المتحدث الرئيسي والمعلق.
بودكاست: مضيفون متعددون.

تفتح ميزة الحوار متعدد الأصوات إمكانيات إبداعية تتجاوز مجرد أصوات الشخصيات. على سبيل المثال، يمكن لمدرسي اللغات الأجنبية استخدام هذه الوظيفة لعرض نفس العبارة بسرعات مختلفة لتعلم اللغة، مما يساعد الطلاب على فهم النطق بمستويات فهم مختلفة. للحصول على تقنيات مفصلة وتطبيقات فصلية، راجع دليلنا حول استخدام تحويل النص إلى كلام لتعليم اللغات الأجنبية.

اختيار الصوت

أصوات متعددة اللغات

تم تصميم الأصوات التي تحتوي على رموز لغات (مثل Ava_US، Ava_ES، Ava_DE) للحفاظ على التعرف المتسق على الصوت عبر لغات مختلفة. تتيح لك هذه الأصوات متعددة اللغات إنشاء نمط موحد للمحتوى متعدد اللغات، مما يضمن أن شخصية الصوت نفسها يمكنها التحدث بلغات متعددة بسلاسة. هذه الميزة مفيدة بشكل خاص في وضع الحوار، حيث يمكنك التبديل بين اللغات مع الحفاظ على نفس شخصية الصوت المميزة طوال مشروعك الصوتي.

تقسيم الصوت

يسمح لك SpeechGen بتقسيم الصوت الذي تم إنشاؤه إلى مقاطع متعددة ضمن مشروع تحويل واحد، مما يجعله مثاليًا لمحرري الفيديو الذين يحتاجون إلى ملفات صوتية منفصلة لمشاهد أو فصول مختلفة. هذه الميزة مفيدة بشكل خاص لإنشاء تعليقات صوتية لمقاطع فيديو يوتيوب أو الدورات التدريبية عبر الإنترنت أو أي مشروع يتطلب مزامنة صوتية دقيقة.

كيفية إنشاء المقاطع

لتقسيم الصوت، ما عليك سوى وضع المؤشر في المكان الذي تريد فيه تقسيم النص والنقر فوق زر القطع في لوحة القائمة. هذا يدرج علامة <cut/> في هذا الموضع. يمكنك أيضًا كتابة هذه العلامة يدويًا أو نسخها ولصقها في نصك. لأسماء الملفات المخصصة، استخدم هذا التنسيق:

<cut name="your-filename"/>

تساعدك هذه الميزة في تنظيم المقاطع بأسماء ذات معنى مثل:

<cut name="intro"/>

<cut name="chapter-1"/>

تنزيل المقاطع وإدارتها

بمجرد إضافة علامة مقطع واحدة على الأقل، يظهر زر "تنزيل المقاطع" بعد الإنشاء. انقر فوقه لتنزيل جميع المقاطع مرة واحدة، أو استخدم زر "المزيد" على مشغل الصوت للوصول إلى المقاطع الفردية. يتم تسمية كل ملف تلقائيًا بمعرف فريد ورقم تسلسلي وعنوان وصفي (مثل "7054789_1_first-sentence")، مما يسهل تحديد وتنظيم ملفات الصوت الخاصة بك في برنامج التحرير الخاص بك.

قيود المقاطع

مقاطع قصيرة: حتى 1000 مقطع لكل عملية إنشاء.
مقاطع طويلة: حتى 500 مقطع لكل عملية إنشاء.

للمشاريع الأكبر، قم بالتقسيم إلى عمليات إنشاء متعددة. للحصول على تعليمات شاملة وتقنيات متقدمة ودروس فيديو، قم بزيارة وثائق تقسيم الصوت الكاملة الخاصة بنا.

إعداد التنغيم

بعض الأصوات لديها رسوم بيانية للتنغيم:

تتوفر الرسوم البيانية للتنغيم على الأصوات التي تعرض أيقونة إعدادات بجوار اسم الصوت - هذه الميزة موجودة في أكثر من نصف الأصوات في المكتبة، بما في ذلك الخيارات العادية والاحترافية.

اسحب النقاط على الرسم البياني لتغيير التنغيم.
ارفع النقاط لزيادة طبقة الصوت على كلمات معينة.
اخفض النقاط لخلق نبرة أكثر جدية.
جرب منحنيات مختلفة للحصول على طبيعية.

اسحب النقاط على الرسم البياني لتغيير التنغيم

حدد الجملة التي تريد تعديل التنغيم فيها واضغط على زر التنغيم. ستظهر هذه الواجهة.

نظام التخزين المؤقت وحفظ الحدود

التخزين المؤقت الذكي

يستخدم SpeechGen.io نظام تخزين مؤقت ذكي يوفر حدودك بشكل كبير. يعمل النظام عن طريق حفظ كل جملة (حتى 100,000 حرف) في ذاكرة التخزين المؤقت لمدة 7 أيام. عندما تقوم بإعادة إنشاء الصوت الخاص بك، يتم استرداد أي جمل لم تتغير تلقائيًا من ذاكرة التخزين المؤقت مجانًا - أنت تدفع فقط مقابل الجمل الجديدة أو المعدلة. هذا يعني أنه يمكنك إجراء تعديلات تدريجية على نصك دون استهلاك كامل حصة الأحرف الخاصة بك في كل مرة. يتم تخزين سجل المشروع لمدة 30 يومًا، ويتم الاحتفاظ بالملفات التي تضيفها إلى المفضلة بشكل دائم.

فترات التخزين:

ذاكرة التخزين المؤقت للجمل: 7 أيام.
سجل المشروع: 30 يومًا.
الملفات المفضلة: مخزنة بشكل دائم.

استكشاف الأخطاء الشائعة وإصلاحها

مشاكل جودة الصوت

الصوت يبدو غير طبيعي:

جرب الأصوات الاحترافية (PRO).
قلل السرعة إلى x0.9-x1.1.
تحقق من صحة علامات الترقيم.
استخدم طبقة صوت محايدة (0).

نطق غير صحيح:

تأكد من اختيار اللغة الصحيحة.
اكتب الكلمات المعقدة صوتيًا.
استخدم علامات SSML للتحكم الدقيق.

وقفات غير طبيعية:

تحقق من علامات الترقيم.
قم بتكوين الوقفات بين الجمل.
استخدم الوقفات اليدوية .- أو <break time=""/>.
قم بإزالة المسافات الزائدة وفواصل الأسطر.

أخطاء SSML:

تحقق من صحة العلامات.
ليست كل الأصوات تدعم جميع علامات SSML.

ميزات إضافية

SSML (لغة ترميز تركيب الكلام)

للتحكم الصوتي الخبير، استخدم علامات SSML:

<break time="2s"/> — الوقفات.
<emphasis level="strong"> — التأكيد على الصوت.
<prosody rate="slow" pitch="low"> — تغيير خصائص الكلام.

⚠️ انتباه: الأصوات المختلفة تدعم مجموعات مختلفة من علامات SSML. اختبر الوظيفة لكل صوت محدد.

السجل والمفضلة

سجل المشروع: يتم حفظه تلقائيًا لمدة 30 يومًا.
المفضلة: أضف المشاريع المهمة للتخزين الدائم.

التكامل وواجهة برمجة التطبيقات (API)

واجهة برمجة التطبيقات (API) متاحة للمطورين لدمج SpeechGen.io في تطبيقاتهم وخدماتهم الخاصة.

ملفي لا يتم تحميله إلى SpeechGen. ماذا أفعل؟

أولاً، تحقق من أن ملفك بتنسيق مدعوم (DOCX، PDF، أو TXT). تأكد من أن الملف غير تالف وحاول التحميل مرة أخرى. إذا استمرت المشكلة، انسخ النص يدويًا والصقه مباشرة في مربع النص. تحقق أيضًا من أن حجم ملفك لا يتجاوز حدود المنصة.

إلى متى يحتفظ SpeechGen بملفات الصوت التي أنشأتها؟

يتم حفظ سجل مشروعك تلقائيًا لمدة 30 يومًا. تستمر ذاكرة التخزين المؤقت الذكية (لحفظ مستوى الجملة) لمدة 7 أيام. للاحتفاظ بالملفات بشكل دائم، أضفها إلى مفضلاتك. هذا يضمن عدم فقدان مشاريع الصوت المهمة الخاصة بك وأنها تظل متاحة في ملفك الشخصي.

هل يمكنني استخدام أصوات مختلفة لشخصيات مختلفة في ملف صوتي واحد؟

نعم! يوفر SpeechGen إنشاء صوت متعدد (وضع الحوار). يمكنك تعيين أصوات مختلفة لأقسام نصية مختلفة، مما يجعله مثاليًا للكتب الصوتية التي تحتوي على شخصيات متعددة، أو الحوارات التعليمية، أو البودكاست مع عدة متحدثين. يمكنك حتى استخدام أصوات متعددة اللغات للتبديل بين اللغات مع الحفاظ على تناسق الشخصية.

ما الفرق بين الأصوات العادية والأصوات الاحترافية (PRO) في SpeechGen؟

تقدم الأصوات الاحترافية (PRO) جودة وطبيعية فائقة مقارنة بالأصوات العادية. عادةً ما تتمتع بتعبير عاطفي أفضل، ونطق أكثر دقة، وبعضها يدعم الميزات المتقدمة مثل رسوم التنغيم البيانية. للمشاريع الاحترافية مثل الكتب الصوتية أو الدورات التدريبية أو العروض التقديمية التجارية، يوصى باستخدام الأصوات الاحترافية (PRO).

هل يؤثر تغيير إعدادات الصوت على حدود الأحرف الخاصة بي؟

يعتمد ذلك على الإعدادات التي تغيرها. يتطلب تعديل سرعة الكلام أو طبقة الصوت إعادة إنشاء كاملة وسيستهلك حدود الأحرف الخاصة بك، حيث تؤثر هذه التغييرات على تركيب الصوت بالكامل. ومع ذلك، يمكنك تعديل الوقفات بين الجمل والفقرات بحرية دون أي استهلاك للحدود. بالإضافة إلى ذلك، يستخدم SpeechGen التخزين المؤقت الذكي: إذا قمت بإنشاء نص كبير، ثم قمت بتعديل جملة واحدة فقط وأعدت الإنشاء، فسيقوم النظام بشحنك فقط لتلك الجملة المتغيرة الواحدة، وليس للنص بأكمله. يوفر نظام التخزين المؤقت هذا الجمل التي لم تتغير لمدة 7 أيام، مما يجعل التحرير التكراري اقتصاديًا للغاية.

فيديو

هل ما زلت لديك أسئلة؟

احصل على المساعدة من مجتمعنا! اطرح أسئلتك في مجموعة Telegram الخاصة بنا: https://t.me/speechgen