08-09-2025 , 16-09-2025
Тіл ашылмалы тізімін ашып, мәтініңіздің тілін таңдаңыз. Қолдау көрсетілетін тілдер: 150-ден астам тіл (AI дыбыстары кітапханасы).
Тілді таңдағаннан кейін дыбыстар тізімі пайда болады. Үлгілерді тыңдап, өзіңізге ұнағанын таңдаңыз
Мәтініңізді мәтін өрісіне көшіріңіз немесе файл жүктеңіз (DOCX, PDF). Субтитрлерді сөйлеуге айналдыру үшін арнайы SRT-тен дыбысқа арналған бетті пайдаланыңыз.
Өңдеуді күтіңіз және дайын дыбыс файлын жүктеп алыңыз
Міне, бәрі осылай! Алғашқы дыбыстық жазбаңыз бірнеше минут ішінде дайын болады.
💡 Кеңес: PDF файлдарынан көшірген кезде мәтінге ерекше назар аударыңыз — дыбысты бұзатын көрінбейтін таңбалар пайда болуы мүмкін!
Бір генерацияға максимум: 2 000 000 таңба (≈ 285 000-330 000 сөз) — бұл бір генерацияда сөйлеуге айналдыра алатын мәтіннің таңғаларлық мөлшері, бұл кітаптар немесе кең құжаттама сияқты ұзақ мазмұн үшін өте қолайлы.
⚠️ Маңызды: Алдымен мәтініңіз үшін дұрыс тілді таңдаңыз
Тілді таңдағаннан кейін қолжетімді дыбыстар тізімі ашылады. Сізге ең қолайлысын табу үшін әр дыбыстың ойнату батырмасын басу арқылы үлгілерді тыңдаңыз. Сіз әртүрлі дыбыс түрлерін көресіз: Қалыпты дыбыстар стандартты сапаны ұсынады, PRO дыбыстары жақсартылған сапа мен табиғилықты қамтамасыз етеді, ал Көптілді дыбыстар (Ava_US, Ava_ES сияқты тіл кодтарымен белгіленген) әртүрлі тілдерде дыбыс үйлесімділігін сақтауға мүмкіндік береді. Әр дыбыстың үні, эмоциясы және сипаты айтарлықтай ерекшеленетіндіктен, оларды қарап шығуға уақыт бөліңіз.
Мәтін өрісінің астында, генерация батырмасының үстінде, кідіріс параметрлерін реттей аласыз:
Өңдеу процесін бастау үшін мәтін өрісінің астындағы "Сөйлеуді жасау" батырмасын басыңыз. Өңдеу уақыты мәтініңіздің ұзындығына байланысты — қысқа мәтіндер секундтарда аяқталады, ал ұзын құжаттар бірнеше минут кетуі мүмкін. Генерация аяқталғаннан кейін, нәтиженің сіздің талаптарыңызға сай екеніне көз жеткізу үшін оны тікелей браузерде тыңдай аласыз.
Генерация аяқталғаннан кейін "Жүктеу" батырмасы пайда болады. Әдепкі бойынша, файлды MP3 ретінде оңай жүктеп алуға болады. Алайда, егер сізге басқа формат (WAV немесе OPUS) қажет болса немесе дыбыс сапасын (8000-нан 44000 Гц дейін) өзгертуді қаласаңыз, алдымен ашылмалы мәзірлерден осы параметрлерді таңдап, таңдалған параметрлермен сөйлеуді қайта жасап, содан кейін қажетті спецификациялармен файлды жүктеп алуыңыз керек.
Жылдамдық шкаласы:
Бұл шкала не үшін: 1-ден аз бөлшек мәндер сөйлеуді баяулатады, 1-ден үлкен мәндер жылдамдатады. Бұл сіздің аудиторияңыз үшін дәл қарқынды таңдауға мүмкіндік береді.
Жылдамдық ұсыныстары:
Биіктік диапазоны: -20-тен +20-ға дейін, 2 қадаммен
Неге 2 қадаммен: 2 бірлік қадамы байқалатын, бірақ өткір емес биіктік өзгерісін қамтамасыз етеді. Кіші қадамдар байқалмайды, үлкен қадамдар тым күрт болады.
Биіктіктің әсері:
Қолданылуы:
Сөйлемдер арасындағы кідірістер: 300ms (әдепкі бойынша)
Абзацтар арасындағы кідірістер: 400ms (әдепкі бойынша)
Бұл параметрлерді 150ms-тен 30 секундқа дейін ашылмалы мәзірлерден өзгертуге болады.
Интерфейс арқылы:
Тегтер арқылы:
Қажетті жерге <break time="200ms"/> немесе <break time="2s"/> тегін енгізіңіз
Кідіріс ережелері:
Кідірістерді қашан қолдану керек:
Бір мәтінде әртүрлі дыбыстарды пайдалануға диалог функциясы мүмкіндік береді.
Көп дыбысты диалог функциясы тек кейіпкер дыбыстарынан тыс шығармашылық мүмкіндіктерді ашады. Мысалы, шет тілі мұғалімдері бұл функцияны тіл үйрену үшін бірдей сөз тіркесін әртүрлі жылдамдықпен көрсету үшін пайдалана алады, бұл студенттерге әртүрлі түсіну деңгейлерінде айтылуын меңгеруге көмектеседі. Толық техникалар мен сыныптық қолданыстар үшін шет тілдерін оқытуда мәтіннен сөйлеуді пайдалану туралы нұсқаулығымызды қараңыз: шeт тілдерін оқытуда мәтіннен сөйлеуді пайдалану.
Тіл кодтары бар дыбыстар (мысалы, Ava_US, Ava_ES, Ava_DE) әртүрлі тілдерде дыбыс тануды сақтауға арналған. Бұл көптілді дыбыстар сізге көптілді мазмұн үшін бірыңғай стиль жасауға мүмкіндік береді, бұл бірдей дыбыс сипатының бірнеше тілде үздіксіз сөйлей алатынына кепілдік береді. Бұл мүмкіндік әсіресе диалог режимінде пайдалы, онда сіз дыбыс жобаңыз бойында кейіпкерді таныс дыбыста сақтай отырып, тілдер арасында ауыса аласыз.
SpeechGen сіздің жасалған дыбысыңызды бір синтез жобасында бірнеше сегментке бөлуге мүмкіндік береді, бұл әртүрлі сахналар немесе тараулар үшін бөлек дыбыс файлдарын қажет ететін видео редакторлары үшін өте қолайлы. Бұл мүмкіндік YouTube бейнелеріне, онлайн курстарға немесе дәл дыбыс синхрондауды талап ететін кез келген жобаға дыбыстық жазба жасау үшін өте пайдалы.
Аудионы бөлу үшін курсорды бөлу қажет жерге қойып, мәзір панеліндегі кесу батырмасын басыңыз. Бұл сол жерде <cut/> тегін енгізеді. Сіз бұл тегті қолмен тере аласыз немесе мәтініңіз бойынша көшіріп қоя аласыз. Арнайы файл атаулары үшін осы форматты пайдаланыңыз:
<cut name="сіздің-файл-атыңыз"/>
Бұл мүмкіндік сегменттерді мағыналы атаулармен ұйымдастыруға көмектеседі, мысалы:
<cut name="кіріспе"/>
<cut name="тарау-1"/>
Ең кем дегенде бір сегмент тегін қосқаннан кейін, генерациядан кейін "сегменттерді жүктеу" батырмасы пайда болады. Барлық сегменттерді бірден жүктеп алу үшін оны басыңыз немесе жеке сегменттерге қол жеткізу үшін дыбыс ойнатқышындағы "көбірек" батырмасын пайдаланыңыз. Әр файл автоматты түрде бірегей идентификаторы, реттік нөмірі және сипаттамалы атауымен аталады (мысалы, "7054789_1_first-sentence"), бұл дыбыс файлдарын өңдеу бағдарламаңызда анықтауды және ұйымдастыруды жеңілдетеді.
Үлкен жобалар үшін бірнеше генерацияға бөліңіз. Толық нұсқаулықтар, озық әдістер және бейне нұсқаулықтар үшін біздің толық дыбыстық сегменттеу құжаттамамызға кіріңіз.
Кейбір дыбыстарда интонация графиктері бар:
Интонация графиктері дыбыс атының жанында параметрлер белгішесі бар дыбыстарда қолжетімді — бұл мүмкіндік кітапханадағы дыбыстардың жартысынан астамында, соның ішінде қалыпты және PRO нұсқаларында да бар.
Интонацияны реттегіңіз келетін сөйлемді таңдап, интонация батырмасын басыңыз. Бұл интерфейс пайда болады.
SpeechGen. сіздің лимиттеріңізді айтарлықтай үнемдейтін интеллектуалды кэштеу жүйесін пайдаланады. Жүйе әрбір сөйлемді (100 000 таңбаға дейін) 7 күн бойы кэште сақтайды. Дыбысыңызды қайта жасаған кезде, өзгертілмеген сөйлемдер автоматты түрде кэштен тегін алынады — сіз тек жаңа немесе өңделген сөйлемдер үшін төлейсіз. Бұл дегеніміз, сіз әр жолы толық таңбалық квотаңызды тұтынбай, мәтініңізге біртіндеп өзгерістер енгізе аласыз. Жоба тарихы 30 күн бойы сақталады, ал сүйіктілеріңізге қосқан файлдар тұрақты сақталады.
Сақтау мерзімдері:
Дыбыс табиғи емес:
Дұрыс айтылмау:
Табиғи емес кідірістер:
SSML қателері:
Сарапшы дыбыс бақылауы үшін SSML тегтерін пайдаланыңыз:
⚠️ Назар аударыңыз: Әртүрлі дыбыстар әртүрлі SSML тегтерін қолдайды. Әрбір нақты дыбыс үшін функцияны тестілеңіз.
API әзірлеушілерге SpeechGen.io-ны өз қолданбалары мен қызметтеріне біріктіру үшін қолжетімді.
Алдымен, файлыңыздың қолдау көрсетілетін форматта (DOCX, PDF немесе TXT) екеніне көз жеткізіңіз. Файлдың бұзылмағанына көз жеткізіп, қайта жүктеуге тырысыңыз. Егер мәселе сақталса, мәтінді қолмен көшіріп, тікелей мәтін өрісіне енгізіңіз. Сондай-ақ, файлыңыздың өлшемі платформа шектеулерінен аспағанына көз жеткізіңіз.
Сіздің жоба тарихыңыз 30 күн бойы автоматты түрде сақталады. Ақылды кэш (сөйлем деңгейіндегі үнемдеу үшін) 7 күн бойы жұмыс істейді. Файларды тұрақты сақтау үшін оларды сүйіктілеріңізге қосыңыз. Бұл сіздің маңызды дыбыс жобаларыңыздың ешқашан жоғалмайтынына және профиліңізде қолжетімді болатынына кепілдік береді.
Иә! SpeechGen көп дыбыстық аудио генерациясын (диалог режимі) ұсынады. Сіз әртүрлі мәтін бөліктеріне әртүрлі дыбыстарды тағайындай аласыз, бұл оны әртүрлі кейіпкерлері бар аудиокітаптар, білім беру диалогтары немесе подкасттар үшін өте қолайлы етеді. Сіз тіпті көптілді дыбыстарды пайдаланып, кейіпкердің үйлесімділігін сақтай отырып, тілдер арасында ауыса аласыз.
PRO дыбыстары қалыпты дыбыстармен салыстырғанда жоғары сапа мен табиғилықты ұсынады. Олар әдетте жақсы эмоционалдық экспрессияға, дәлірек айтылуға ие және кейбіреулері интонация графиктері сияқты озық функцияларды қолдайды. Аудиокітаптар, курстар немесе бизнес презентациялары сияқты кәсіби жобалар үшін PRO дыбыстары ұсынылады.
Бұл қандай параметрлерді өзгертетініңізге байланысты. Сөйлеу жылдамдығын немесе биіктігін реттеу толық қайта генерацияны талап етеді және бұл өзгерістер бүкіл дыбыстық синтезге әсер ететіндіктен, сіздің таңбалық лимиттеріңізді тұтынады. Алайда, сіз сөйлемдер мен абзацтар арасындағы кідірістерді ешқандай лимит тұтынбай еркін өзгерте аласыз. Сонымен қатар, SpeechGen ақылды кэштеуді пайдаланады: егер сіз үлкен мәтінді жасап, содан кейін тек бір сөйлемді өңдеп, қайта жасасаңыз, жүйе сізден тек сол өзгертілген сөйлем үшін ақы алады, бүкіл мәтін үшін емес. Бұл кэштеу жүйесі өзгертілмеген сөйлемдеріңізді 7 күн бойы сақтайды, бұл итеративті өңдеуді өте үнемді етеді.
Қауымдастығымыздан көмек алыңыз! Сұрақтарыңызды Telegram чатымызда қойыңыз: https://t.me/speechgen