SpeechGen.io сайтында мәтінді сөйлетуді пайдалану: Толық нұсқаулық

08-09-2025 , 16-09-2025

🚀 Жылдам бастау — 4 қадамда дыбыс жасаңыз

1-қадам: Тілді таңдаңыз

Тіл ашылмалы тізімін ашып, мәтініңіздің тілін таңдаңыз. Қолдау көрсетілетін тілдер: 150-ден астам тіл (AI дыбыстары кітапханасы).

2-қадам: Дыбысты таңдаңыз

Тілді таңдағаннан кейін дыбыстар тізімі пайда болады. Үлгілерді тыңдап, өзіңізге ұнағанын таңдаңыз

3-қадам: Мәтінді енгізіңіз

Мәтініңізді мәтін өрісіне көшіріңіз немесе файл жүктеңіз (DOCX, PDF). Субтитрлерді сөйлеуге айналдыру үшін арнайы SRT-тен дыбысқа арналған бетті пайдаланыңыз.

4-қадам: "Сөйлеуді жасау" (көк түйме) батырмасын басыңыз

4-қадам: Сөйлеуді жасау батырмасын басыңыз

Өңдеуді күтіңіз және дайын дыбыс файлын жүктеп алыңыз

Міне, бәрі осылай! Алғашқы дыбыстық жазбаңыз бірнеше минут ішінде дайын болады.

Мәтінді дайындау

Ұсынылады:

Артық таңбаларсыз жай мәтінді пайдаланыңыз
Тыныс белгілерін (нүктелер, үтірлер, леп белгілері) дұрыс қойыңыз
Ұзын мәтінді абзацтарға бөліңіз

Болдырмаңыз:

Эмодзилер мен эмотикондар (дыбыс жасауды бұзуы мүмкін)
Экзотикалық таңбалар: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
Арнайы Unicode таңбалары:

💡 Кеңес: PDF файлдарынан көшірген кезде мәтінге ерекше назар аударыңыз — дыбысты бұзатын көрінбейтін таңбалар пайда болуы мүмкін!

Шектеулер мен тыйымдар

Қолдау көрсетілетін тілдер: 150+ тіл (толық тізім).
Жүктеу форматтары: жай мәтін, DOCX, PDF, SRT.

Бір генерацияға максимум: 2 000 000 таңба (≈ 285 000-330 000 сөз) — бұл бір генерацияда сөйлеуге айналдыра алатын мәтіннің таңғаларлық мөлшері, бұл кітаптар немесе кең құжаттама сияқты ұзақ мазмұн үшін өте қолайлы.

Толық қадамдық нұсқаулық

1-қадам: Мәтінді жүктеу

Мәтінді енгізу: Мәтініңізді мәтін өрісіне көшіріңіз
Файлды жүктеу: Немесе жүктеу батырмасын басып, файлды таңдаңыз (DOCX, PDF)
Мәтінді тексеру: Мәтіннің дұрыс көрсетілгеніне көз жеткізіңіз

2-қадам: Тілді таңдау

⚠️ Маңызды: Алдымен мәтініңіз үшін дұрыс тілді таңдаңыз

Тіл ашылмалы тізімін ашыңыз
Қажетті тілді табыңыз (150-ден астам тіл бар)
Көптілді мәтіндер үшін көп дыбыстық генерацияны пайдаланыңыз

3-қадам: Дыбысты таңдау

Тілді таңдағаннан кейін қолжетімді дыбыстар тізімі ашылады. Сізге ең қолайлысын табу үшін әр дыбыстың ойнату батырмасын басу арқылы үлгілерді тыңдаңыз. Сіз әртүрлі дыбыс түрлерін көресіз: Қалыпты дыбыстар стандартты сапаны ұсынады, PRO дыбыстары жақсартылған сапа мен табиғилықты қамтамасыз етеді, ал Көптілді дыбыстар (Ava_US, Ava_ES сияқты тіл кодтарымен белгіленген) әртүрлі тілдерде дыбыс үйлесімділігін сақтауға мүмкіндік береді. Әр дыбыстың үні, эмоциясы және сипаты айтарлықтай ерекшеленетіндіктен, оларды қарап шығуға уақыт бөліңіз.

4-қадам: Параметрлерді конфигурациялау

Сөйлеу жылдамдығы: x0.1 (өте баяу) - x2.2 (өте жылдам)
Дыбыс биіктігі: -20 - +20 (2 қадаммен)

Мәтін өрісінің астында, генерация батырмасының үстінде, кідіріс параметрлерін реттей аласыз:

кідіріс параметрлері

Сөйлемдер арасындағы кідірістер: 150ms - 30 секунд
Абзацтар арасындағы кідірістер: 150ms - 30 секунд

5-қадам: Сөйлеуді жасау

Өңдеу процесін бастау үшін мәтін өрісінің астындағы "Сөйлеуді жасау" батырмасын басыңыз. Өңдеу уақыты мәтініңіздің ұзындығына байланысты — қысқа мәтіндер секундтарда аяқталады, ал ұзын құжаттар бірнеше минут кетуі мүмкін. Генерация аяқталғаннан кейін, нәтиженің сіздің талаптарыңызға сай екеніне көз жеткізу үшін оны тікелей браузерде тыңдай аласыз.

6-қадам: Жүктеу

Генерация аяқталғаннан кейін "Жүктеу" батырмасы пайда болады. Әдепкі бойынша, файлды MP3 ретінде оңай жүктеп алуға болады. Алайда, егер сізге басқа формат (WAV немесе OPUS) қажет болса немесе дыбыс сапасын (8000-нан 44000 Гц дейін) өзгертуді қаласаңыз, алдымен ашылмалы мәзірлерден осы параметрлерді таңдап, таңдалған параметрлермен сөйлеуді қайта жасап, содан кейін қажетті спецификациялармен файлды жүктеп алуыңыз керек.

Дыбыс параметрлерін орнату

Сөйлеу жылдамдығы

Жылдамдық шкаласы:

x0.1 - x0.9: Баяулату (күрделі материалдар, тіл үйрену үшін)
x1.0: Қалыпты жылдамдық (әдепкі бойынша)
x1.1 - x2.2: Жылдамдату (динамикалық мазмұн үшін)

Бұл шкала не үшін: 1-ден аз бөлшек мәндер сөйлеуді баяулатады, 1-ден үлкен мәндер жылдамдатады. Бұл сіздің аудиторияңыз үшін дәл қарқынды таңдауға мүмкіндік береді.

Жылдамдық ұсыныстары:

Білім: x0.8-x1.0 (жақсы түсіну үшін)
Презентациялар: x0.9-x1.1 (ресми қарқын)
Подкасттар: x1.0-x1.2 (өміршең қарқын)
YouTube: x1.1-x1.4 (назар аудару)

Дыбыс биіктігі

Биіктік диапазоны: -20-тен +20-ға дейін, 2 қадаммен

Неге 2 қадаммен: 2 бірлік қадамы байқалатын, бірақ өткір емес биіктік өзгерісін қамтамасыз етеді. Кіші қадамдар байқалмайды, үлкен қадамдар тым күрт болады.

Биіктіктің әсері:

Теріс мәндер (-2-тен -20-ға дейін): Дыбысты төмен, салмақты, беделді етеді
Оң мәндер (+2-тен +20-ға дейін): Дыбысты жоғары, достық, энергиялы етеді
0: Бейтарап биіктік (әдепкі бойынша)

Қолданылуы:

Бизнес мазмұны: -4-тен +2-ге дейін
Балалар мазмұны: +4-тен +12-ге дейін
Драмалық мазмұн: -8-ден -16-ға дейін
Достық мазмұн: +2-ден +8-ге дейін

Кідірістермен жұмыс істеу

Автоматты кідірістер

Сөйлемдер арасындағы кідірістер: 300ms (әдепкі бойынша)

Абзацтар арасындағы кідірістер: 400ms (әдепкі бойынша)

Бұл параметрлерді 150ms-тен 30 секундқа дейін ашылмалы мәзірлерден өзгертуге болады.

Қолмен кідіріс қою

Интерфейс арқылы:

Курсорды мәтінде қажетті жерге қойыңыз
Мәзірдегі "Кідіріс" батырмасын басыңыз
Мәтінде .- таңбасы пайда болады

Тегтер арқылы:

Қажетті жерге <break time="200ms"/> немесе <break time="2s"/> тегін енгізіңіз

Кідіріс ережелері:

Максималды кідіріс: 30 секунд
Ұзақ кідіріс үшін бірнеше кідірісті қатарынан қоюға болады
Кідірістер қосымша лимиттерді тұтынбайды

Кідірістерді қашан қолдану керек:

Маңызды мәлімдемелер алдында
Риторикалық сұрақтардан кейін
Әртүрлі тақырыптар арасында
Драмалық әсер жасау үшін

Көп дыбыстық аудио

Бір мәтінде әртүрлі дыбыстарды пайдалануға диалог функциясы мүмкіндік береді.

Қолданылуы:

Аудиокітаптар: Кейіпкерлер үшін әртүрлі дыбыстар
Білім беру диалогтары: Мұғалім және студент
Презентациялар: Бас спикер және комментатор
Подкасттар: Бірнеше жүргізуші

Көп дыбысты диалог функциясы тек кейіпкер дыбыстарынан тыс шығармашылық мүмкіндіктерді ашады. Мысалы, шет тілі мұғалімдері бұл функцияны тіл үйрену үшін бірдей сөз тіркесін әртүрлі жылдамдықпен көрсету үшін пайдалана алады, бұл студенттерге әртүрлі түсіну деңгейлерінде айтылуын меңгеруге көмектеседі. Толық техникалар мен сыныптық қолданыстар үшін шет тілдерін оқытуда мәтіннен сөйлеуді пайдалану туралы нұсқаулығымызды қараңыз: шeт тілдерін оқытуда мәтіннен сөйлеуді пайдалану.

Дыбыс таңдау

Көптілді дыбыстар

Тіл кодтары бар дыбыстар (мысалы, Ava_US, Ava_ES, Ava_DE) әртүрлі тілдерде дыбыс тануды сақтауға арналған. Бұл көптілді дыбыстар сізге көптілді мазмұн үшін бірыңғай стиль жасауға мүмкіндік береді, бұл бірдей дыбыс сипатының бірнеше тілде үздіксіз сөйлей алатынына кепілдік береді. Бұл мүмкіндік әсіресе диалог режимінде пайдалы, онда сіз дыбыс жобаңыз бойында кейіпкерді таныс дыбыста сақтай отырып, тілдер арасында ауыса аласыз.

Аудио сегменттеу

SpeechGen сіздің жасалған дыбысыңызды бір синтез жобасында бірнеше сегментке бөлуге мүмкіндік береді, бұл әртүрлі сахналар немесе тараулар үшін бөлек дыбыс файлдарын қажет ететін видео редакторлары үшін өте қолайлы. Бұл мүмкіндік YouTube бейнелеріне, онлайн курстарға немесе дәл дыбыс синхрондауды талап ететін кез келген жобаға дыбыстық жазба жасау үшін өте пайдалы.

Сегменттерді қалай жасауға болады

Аудионы бөлу үшін курсорды бөлу қажет жерге қойып, мәзір панеліндегі кесу батырмасын басыңыз. Бұл сол жерде <cut/> тегін енгізеді. Сіз бұл тегті қолмен тере аласыз немесе мәтініңіз бойынша көшіріп қоя аласыз. Арнайы файл атаулары үшін осы форматты пайдаланыңыз:

<cut name="сіздің-файл-атыңыз"/>

Бұл мүмкіндік сегменттерді мағыналы атаулармен ұйымдастыруға көмектеседі, мысалы:

<cut name="кіріспе"/>

<cut name="тарау-1"/>

Сегменттерді жүктеу және басқару

Ең кем дегенде бір сегмент тегін қосқаннан кейін, генерациядан кейін "сегменттерді жүктеу" батырмасы пайда болады. Барлық сегменттерді бірден жүктеп алу үшін оны басыңыз немесе жеке сегменттерге қол жеткізу үшін дыбыс ойнатқышындағы "көбірек" батырмасын пайдаланыңыз. Әр файл автоматты түрде бірегей идентификаторы, реттік нөмірі және сипаттамалы атауымен аталады (мысалы, "7054789_1_first-sentence"), бұл дыбыс файлдарын өңдеу бағдарламаңызда анықтауды және ұйымдастыруды жеңілдетеді.

Сегмент шектеулері

Қысқа сегменттер: Бір генерацияға 1000 сегментке дейін
Ұзын сегменттер: Бір генерацияға 500 сегментке дейін

Үлкен жобалар үшін бірнеше генерацияға бөліңіз. Толық нұсқаулықтар, озық әдістер және бейне нұсқаулықтар үшін біздің толық дыбыстық сегменттеу құжаттамамызға кіріңіз.

Интонацияны орнату

Кейбір дыбыстарда интонация графиктері бар:

Интонация графиктері дыбыс атының жанында параметрлер белгішесі бар дыбыстарда қолжетімді — бұл мүмкіндік кітапханадағы дыбыстардың жартысынан астамында, соның ішінде қалыпты және PRO нұсқаларында да бар.

Интонацияны өзгерту үшін графикадағы нүктелерді сүйреңіз
Белгілі бір сөздерде биіктікті арттыру үшін нүктелерді көтеріңіз
Салмақты тон жасау үшін нүктелерді төмендетіңіз
Табиғилық үшін әртүрлі қисықтарды қолданып көріңіз

Интонацияны өзгерту үшін графикадағы нүктелерді сүйреңіз

Интонацияны реттегіңіз келетін сөйлемді таңдап, интонация батырмасын басыңыз. Бұл интерфейс пайда болады.

Кэштеу жүйесі және лимиттерді үнемдеу

Ақылды кэш

SpeechGen. сіздің лимиттеріңізді айтарлықтай үнемдейтін интеллектуалды кэштеу жүйесін пайдаланады. Жүйе әрбір сөйлемді (100 000 таңбаға дейін) 7 күн бойы кэште сақтайды. Дыбысыңызды қайта жасаған кезде, өзгертілмеген сөйлемдер автоматты түрде кэштен тегін алынады — сіз тек жаңа немесе өңделген сөйлемдер үшін төлейсіз. Бұл дегеніміз, сіз әр жолы толық таңбалық квотаңызды тұтынбай, мәтініңізге біртіндеп өзгерістер енгізе аласыз. Жоба тарихы 30 күн бойы сақталады, ал сүйіктілеріңізге қосқан файлдар тұрақты сақталады.

Сақтау мерзімдері:

Сөйлем кэші: 7 күн
Жоба тарихы: 30 күн
Сүйікті файлдар: Тұрақты сақталады

Жалпы мәселелерді шешу

Дыбыс сапасы мәселелері

Дыбыс табиғи емес:

PRO дыбыстарын қолданып көріңіз
Жылдамдықты x0.9-x1.1 дейін азайтыңыз
Тыныс белгілерінің дұрыстығын тексеріңіз
Бейтарап биіктікті (0) пайдаланыңыз

Дұрыс айтылмау:

Дұрыс тіл таңдалғанына көз жеткізіңіз
Күрделі сөздерді фонетикалық түрде жазыңыз
Нақты бақылау үшін SSML тегтерін пайдаланыңыз

Табиғи емес кідірістер:

Тыныс белгілерін тексеріңіз
Сөйлемдер арасындағы кідірістерді конфигурациялаңыз
Қолмен кідірістерді .- немесе <break time=""/> пайдаланыңыз
Артық бос орындар мен жолдарды алып тастаңыз

SSML қателері:

Тегтердің дұрыстығын тексеріңіз
Барлық дыбыстар барлық SSML тегтерін қолдамайды

Қосымша мүмкіндіктер

SSML (Speech Synthesis Markup Language)

Сарапшы дыбыс бақылауы үшін SSML тегтерін пайдаланыңыз:

<break time="2s"/> — кідірістер
<emphasis level="strong"> — дыбыс екпіні
<prosody rate="slow" pitch="low"> — сөйлеу сипаттамаларын өзгерту

⚠️ Назар аударыңыз: Әртүрлі дыбыстар әртүрлі SSML тегтерін қолдайды. Әрбір нақты дыбыс үшін функцияны тестілеңіз.

Тарих және сүйіктілер

Жоба тарихы: 30 күн бойы автоматты түрде сақталады
Сүйіктілер: Маңызды жобаларды тұрақты сақтау үшін қосыңыз

Интеграция және API

API әзірлеушілерге SpeechGen.io-ны өз қолданбалары мен қызметтеріне біріктіру үшін қолжетімді.

Файлым SpeechGen-ге жүктелмейді. Не істеуім керек?

Алдымен, файлыңыздың қолдау көрсетілетін форматта (DOCX, PDF немесе TXT) екеніне көз жеткізіңіз. Файлдың бұзылмағанына көз жеткізіп, қайта жүктеуге тырысыңыз. Егер мәселе сақталса, мәтінді қолмен көшіріп, тікелей мәтін өрісіне енгізіңіз. Сондай-ақ, файлыңыздың өлшемі платформа шектеулерінен аспағанына көз жеткізіңіз.

SpeechGen менің жасалған дыбыс файлдарымды қанша уақыт сақтайды?

Сіздің жоба тарихыңыз 30 күн бойы автоматты түрде сақталады. Ақылды кэш (сөйлем деңгейіндегі үнемдеу үшін) 7 күн бойы жұмыс істейді. Файларды тұрақты сақтау үшін оларды сүйіктілеріңізге қосыңыз. Бұл сіздің маңызды дыбыс жобаларыңыздың ешқашан жоғалмайтынына және профиліңізде қолжетімді болатынына кепілдік береді.

Бір дыбыс файлында әртүрлі кейіпкерлер үшін әртүрлі дыбыстарды қолдана аламын ба?

Иә! SpeechGen көп дыбыстық аудио генерациясын (диалог режимі) ұсынады. Сіз әртүрлі мәтін бөліктеріне әртүрлі дыбыстарды тағайындай аласыз, бұл оны әртүрлі кейіпкерлері бар аудиокітаптар, білім беру диалогтары немесе подкасттар үшін өте қолайлы етеді. Сіз тіпті көптілді дыбыстарды пайдаланып, кейіпкердің үйлесімділігін сақтай отырып, тілдер арасында ауыса аласыз.

SpeechGen-дегі қалыпты және PRO дыбыстарының айырмашылығы неде?

PRO дыбыстары қалыпты дыбыстармен салыстырғанда жоғары сапа мен табиғилықты ұсынады. Олар әдетте жақсы эмоционалдық экспрессияға, дәлірек айтылуға ие және кейбіреулері интонация графиктері сияқты озық функцияларды қолдайды. Аудиокітаптар, курстар немесе бизнес презентациялары сияқты кәсіби жобалар үшін PRO дыбыстары ұсынылады.

Дыбыс параметрлерін өзгерту менің таңбалық лимиттерімді тұтына ма?

Бұл қандай параметрлерді өзгертетініңізге байланысты. Сөйлеу жылдамдығын немесе биіктігін реттеу толық қайта генерацияны талап етеді және бұл өзгерістер бүкіл дыбыстық синтезге әсер ететіндіктен, сіздің таңбалық лимиттеріңізді тұтынады. Алайда, сіз сөйлемдер мен абзацтар арасындағы кідірістерді ешқандай лимит тұтынбай еркін өзгерте аласыз. Сонымен қатар, SpeechGen ақылды кэштеуді пайдаланады: егер сіз үлкен мәтінді жасап, содан кейін тек бір сөйлемді өңдеп, қайта жасасаңыз, жүйе сізден тек сол өзгертілген сөйлем үшін ақы алады, бүкіл мәтін үшін емес. Бұл кэштеу жүйесі өзгертілмеген сөйлемдеріңізді 7 күн бойы сақтайды, бұл итеративті өңдеуді өте үнемді етеді.

Бейне

Әлі сұрақтарыңыз бар ма?

Қауымдастығымыздан көмек алыңыз! Сұрақтарыңызды Telegram чатымызда қойыңыз: https://t.me/speechgen