SpeechGen.io'da Metni Konuşmaya Nasıl Dönüştürülür: Kapsamlı Rehber
08-09-2025 , 16-09-2025
🚀 Hızlı Başlangıç — 4 Adımda Ses Oluşturun
Adım 1: Dil Seçin

Dil açılır menüsünü açın ve metninizin dilini seçin. Desteklenen diller: 150'den fazla dil (Yapay zeka sesleri kütüphanesi).
Adım 2: Ses Seçin

Dili seçtikten sonra bir ses listesi görünecektir. Örnekleri dinleyin ve favorinizi seçin
Adım 3: Metni Yapıştırın
Metninizi metin kutusuna kopyalayın veya bir dosya yükleyin (DOCX, PDF). Altyazıları konuşmaya dönüştürmek için özel SRT'den Sese sayfayı kullanın.
Adım 4: "Konuşma Oluştur" (mavi düğme) düğmesine tıklayın
İşlenmesini bekleyin ve hazır ses dosyanızı indirin
İşte bu kadar! İlk seslendirmeniz sadece birkaç dakika içinde hazır.
Metin Hazırlığı
Önerilenler:
- Gereksiz semboller olmadan düz metin kullanın
- Noktalama işaretlerini (nokta, virgül, ünlem) doğru yerleştirin
- Uzun metinleri paragraflara bölün
Kaçınılması Gerekenler:
- Emojiler ve ifadeler (ses üretimini bozabilir)
- Egzotik semboller: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
- Özel Unicode sembolleri: 
💡 İpucu: PDF dosyalarından kopyalarken metne özellikle dikkat edin — ses kalitesini bozabilecek görünmez karakterler görünebilir!
Sınırlar ve Kısıtlamalar
Tek seferde maksimum: 2.000.000 karakter (≈ 285.000-330.000 kelime) - bu, tek bir üretimde konuşmaya dönüştürebileceğiniz etkileyici bir metin miktarıdır, bu da onu tüm kitaplar veya kapsamlı belgeler gibi uzun biçimli içerikler için ideal hale getirir.
Detaylı Adım Adım Talimatlar
Adım 1: Metin Yükleme
- Metni yapıştırın: Metninizi metin kutusuna kopyalayın
- Dosya yükleyin: Veya yükleme düğmesine tıklayın ve bir dosya seçin (DOCX, PDF)
- Metni kontrol edin: Metnin doğru görüntülendiğinden emin olun
Adım 2: Dil Seçimi
⚠️ Önemli: Önce metniniz için doğru dili seçin
- Dil açılır listesini açın
- İhtiyacınız olan dili bulun (150'den fazla dil mevcut)
- Çok dilli metinler için çoklu ses üretimi kullanın
Adım 3: Ses Seçimi
Dili seçtikten sonra, mevcut seslerin bir listesi açılacaktır. İhtiyaçlarınıza en uygun olanı bulmak için her sesin oynat düğmesine tıklayarak örnekleri dinleyin. Farklı ses türleri mevcuttur: Normal sesler standart kalite sunar, PRO sesler geliştirilmiş kalite ve doğallık sağlar ve Çok dilli sesler (Ava_US, Ava_ES gibi dil kodlarıyla işaretlenmiş) farklı dillerde ses tutarlılığını korumanıza olanak tanır. Ton, duygu ve karakter açısından önemli ölçüde farklılık gösterdikleri için her sesi önizlemek için zaman ayırın.
Adım 4: Parametreleri Yapılandırma
- Konuşma hızı: x0.1 (çok yavaş) ile x2.2 (çok hızlı) arası
- Ses perdesi: -20 ile +20 arası (2'lik adımlarla)
Metin kutusunun altında, oluşturma düğmesinin üzerinde duraklama ayarlarını yapabilirsiniz:
- Cümleler arası duraklamalar: 150ms - 30 saniye
- Paragraflar arası duraklamalar: 150ms - 30 saniye
Adım 5: Konuşma Oluşturma
Dönüştürme işlemini başlatmak için metin kutusunun altındaki "Konuşma Oluştur" düğmesine tıklayın. İşlem süresi metin uzunluğunuza bağlıdır - daha kısa metinler saniyeler içinde tamamlanırken, daha uzun belgeler birkaç dakika sürebilir. Oluşturma tamamlandıktan sonra, beklentilerinizi karşıladığından emin olmak için sonucu doğrudan tarayıcıda dinleyebilirsiniz.
Adım 6: İndirme
Oluşturma tamamlandıktan sonra bir "İndir" düğmesi görünecektir. Varsayılan olarak dosyayı MP3 olarak indirebilirsiniz. Ancak, farklı bir format (WAV veya OPUS) istiyorsanız veya ses kalitesini değiştirmek istiyorsanız (8000 ila 44000 Hz arası örnekleme hızı), önce bu seçenekleri açılır menülerden seçmeniz, konuşmayı seçtiğiniz ayarlarla yeniden oluşturmanız ve ardından dosyayı tercih ettiğiniz özelliklerle indirmeniz gerekir.
Ses Parametre Ayarları
Konuşma Hızı
Hız ölçeği:
- x0.1 - x0.9: Yavaşlatma (karmaşık materyaller, dil öğrenimi için)
- x1.0: Normal hız (varsayılan)
- x1.1 - x2.2: Hızlandırma (dinamik içerikler için)
Bu ölçeğin nedeni: 1'den küçük kesirli değerler konuşmayı yavaşlatır, 1'den büyük değerler hızlandırır. Bu, dinleyiciniz için hassas tempo seçimi sağlar.
Hız önerileri:
- Eğitim: x0.8-x1.0 (daha iyi anlaşılabilirlik için)
- Sunumlar: x0.9-x1.1 (resmi tempo)
- Podcast'ler: x1.0-x1.2 (canlı tempo)
- YouTube: x1.1-x1.4 (dikkat çekme)
Ses Perdesi
Perde aralığı: -20 ile +20 arası, 2'lik adımlarla
Neden 2'lik adım: 2 birimlik bir adım, fark edilebilir ancak keskin olmayan bir perde değişikliği sağlar. Daha küçük adımlar fark edilmez, daha büyük adımlar ise çok dramatik olur.
Perde etkisi:
- Negatif değerler (-2 ila -20): Sesi daha alçak, daha ciddi, otoriter yapar
- Pozitif değerler (+2 ila +20): Sesi daha yüksek, daha samimi, daha enerjik yapar
- 0: Nötr perde (varsayılan)
Uygulamalar:
- İş içerikleri: -4 ila +2
- Çocuk içerikleri: +4 ila +12
- Dramatik içerikler: -8 ila -16
- Samimi içerikler: +2 ila +8
Duraklamalarla Çalışma
Otomatik Duraklamalar
Cümleler arası duraklamalar: 300ms (varsayılan)
Paragraflar arası duraklamalar: 400ms (varsayılan)
Bu ayarlar 150ms ile 30 saniye arasında açılır menülerden değiştirilebilir.
Manuel Duraklama Ekleme
Arayüz aracılığıyla:
- İmleci metindeki istediğiniz konuma yerleştirin
- Menüdeki "Duraklama" düğmesine tıklayın
- Metinde .- sembolü görünecektir
Etiketler aracılığıyla:
İstediğiniz konuma <break time="200ms"/> veya <break time="2s"/> etiketini ekleyin
Duraklama kuralları:
- Maksimum duraklama: 30 saniye
- Daha uzun gecikme için art arda birden fazla duraklama yerleştirebilirsiniz
- Duraklamalar ek limit tüketmez
Duraklamalar ne zaman kullanılır:
- Önemli ifadelerden önce
- Retorik sorulardan sonra
- Farklı konular arasında
- Dramatik etki yaratmak için
Çoklu Seslendirme
Bu diyalog özelliği, tek bir metinde farklı sesler kullanmanıza olanak tanır.
Uygulamalar:
- Sesli kitaplar: Karakterler için farklı sesler
- Eğitim diyalogları: Öğretmen ve öğrenci
- Sunumlar: Ana konuşmacı ve yorumcu
- Podcast'ler: Birden fazla sunucu
Çoklu seslendirme özelliği, karakter seslerinin ötesinde yaratıcı olanaklar sunar. Örneğin, yabancı dil öğretmenleri, dil öğrenimi için aynı ifadeyi farklı hızlarda göstermek amacıyla bu özelliği kullanarak öğrencilerin farklı anlama seviyelerinde telaffuzu kavramalarına yardımcı olabilirler. Detaylı teknikler ve sınıf uygulamaları için, yabancı dil öğretimi için metinden sese kullanma konusundaki rehberimize bakın: yabancı dil öğretimi için metinden sese kullanma.
Ses Seçimi
Çok Dilli Sesler
Dil kodlarına sahip sesler (örneğin, Ava_US, Ava_ES, Ava_DE), farklı dillerde tutarlı ses tanıma sağlamak üzere tasarlanmıştır. Bu çok dilli sesler, çok dilli içerikler için birleşik bir stil oluşturmanıza olanak tanır ve aynı ses karakterinin birden fazla dili sorunsuz bir şekilde konuşabilmesini sağlar. Bu özellik, özellikle diyalog modunda, ses projeniz boyunca aynı tanınabilir ses kişiliğini korurken diller arasında geçiş yapmanıza olanak tanır.
Ses Segmentasyonu
SpeechGen, tek bir sentez projesi içinde sesinizi birden fazla segmente ayırmanıza olanak tanır, bu da onu farklı sahneler veya bölümler için ayrı ses dosyalarına ihtiyaç duyan video editörleri için mükemmel kılar. Bu özellik, YouTube videoları, çevrimiçi kurslar veya hassas ses senkronizasyonu gerektiren herhangi bir proje için seslendirmeler oluşturmak üzere özellikle kullanışlıdır.
Segment Oluşturma
Sesinizi bölmek için imlecinizi bölmek istediğiniz yere yerleştirin ve menü panelindeki kesme düğmesine tıklayın. Bu, o konuma bir <cut/> etiketi ekler. Bu etiketi metniniz boyunca manuel olarak da yazabilir veya kopyalayıp yapıştırabilirsiniz. Özel dosya adları için şu formatı kullanın:
<cut name="dosya-adiniz"/>
Bu özellik, anlamlı adlarla segmentleri düzenlemenize yardımcı olur:
<cut name="giris"/>
<cut name="bolum-1"/>
Segmentleri İndirme ve Yönetme
En az bir segment etiketi ekledikten sonra, oluşturma sonrasında bir "segmentleri indir" düğmesi görünür. Tüm segmentleri tek seferde indirmek için tıklayın veya bireysel segmentlere erişmek için ses oynatıcısındaki "daha fazla" düğmesini kullanın. Her dosya otomatik olarak benzersiz bir kimlik, sıra numarası ve açıklayıcı başlık ile adlandırılır (örneğin, "7054789_1_ilk-cumle"), bu da ses dosyalarınızı düzenleme yazılımınızda tanımlamayı ve organize etmeyi kolaylaştırır.
Segment Sınırlamaları
- Kısa segmentler: Üretim başına 1000 segmente kadar
- Uzun segmentler: Üretim başına 500 segmente kadar
Daha büyük projeler için birden fazla üretime bölün. Kapsamlı talimatlar, gelişmiş teknikler ve video eğitimleri için tam ses segmentasyonu belgelerimize bakın.
Entonasyon Ayarı
Bazı seslerde entonasyon grafikleri bulunur:
Entonasyon grafikleri, ses adının yanında bir ayarlar simgesi gösteren seslerde mevcuttur - bu özellik, hem normal hem de PRO seçenekleri dahil olmak üzere kütüphanedeki seslerin yarısından fazlasında bulunur
- Entonasyonu değiştirmek için grafikteki noktaları sürükleyin
- Belirli kelimelerdeki perdeyi artırmak için noktaları yükseltin
- Daha ciddi bir ton oluşturmak için noktaları indirin
- Doğallık için farklı eğrilerle deney yapın
Entonasyonu ayarlamak istediğiniz cümleyi seçin ve entonasyon düğmesine basın. Bu arayüz görünecektir.
Önbellekleme Sistemi ve Limit Tasarrufu
Akıllı Önbellek
SpeechGen.io, limitlerinizi önemli ölçüde tasarruf sağlayan akıllı bir önbellekleme sistemi kullanır. Sistem, her cümleyi (100.000 karaktere kadar) 7 gün boyunca önbellekte saklayarak çalışır. Sesinizi yeniden oluşturduğunuzda, değişmeyen cümleler otomatik olarak ücretsiz olarak önbellekten alınır - yalnızca yeni veya düzenlenmiş cümleler için ödeme yaparsınız. Bu, karakter limitinizi her seferinde tüketmeden metninizde artımlı düzenlemeler yapabileceğiniz anlamına gelir. Proje geçmişi 30 gün boyunca saklanır ve favorilerinize eklediğiniz dosyalar kalıcı olarak tutulur.
Saklama süreleri:
- Cümle önbelleği: 7 gün
- Proje geçmişi: 30 gün
- Favori dosyalar: Kalıcı olarak saklanır
Yaygın Sorun Giderme
Ses Kalitesi Sorunları
Ses doğal gelmiyor:
- PRO sesleri deneyin
- Hızı x0.9-x1.1'e düşürün
- Noktalama doğruluğunu kontrol edin
- Nötr perde (0) kullanın
Yanlış telaffuz:
- Doğru dilin seçildiğinden emin olun
- Karmaşık kelimeleri fonetik olarak yazın
- Hassas kontrol için SSML etiketlerini kullanın
Doğal olmayan duraklamalar:
- Noktalama işaretlerini kontrol edin
- Cümleler arası duraklamaları yapılandırın
- Manuel duraklamaları .- veya <break time=""/> kullanın
- Fazladan boşlukları ve satır sonlarını kaldırın
SSML hataları:
- Etiket doğruluğunu kontrol edin
- Tüm sesler tüm SSML etiketlerini desteklemez
Ek Özellikler
SSML (Speech Synthesis Markup Language)
Uzman ses kontrolü için SSML etiketlerini kullanın:
- <break time="2s"/> — duraklamalar
- <emphasis level="strong"> — ses vurgusu
- <prosody rate="slow" pitch="low"> — konuşma özellikleri değişikliği
⚠️ Dikkat: Farklı sesler farklı SSML etiket setlerini destekler. Her belirli ses için işlevselliği test edin.
Geçmiş ve Favoriler
- Proje geçmişi: 30 gün boyunca otomatik olarak kaydedilir
- Favoriler: Önemli projeleri kalıcı depolama için ekleyin
Entegrasyon ve API
API, geliştiricilerin SpeechGen.io'yu kendi uygulamalarına ve hizmetlerine entegre etmeleri için mevcuttur.
Dosyam SpeechGen'e yüklenmiyor. Ne yapmalıyım?
Öncelikle, dosyanızın desteklenen bir formatta (DOCX, PDF veya TXT) olduğundan emin olun. Dosyanın bozuk olmadığından emin olun ve tekrar yüklemeyi deneyin. Sorun devam ederse, metni manuel olarak kopyalayıp doğrudan metin kutusuna yapıştırın. Ayrıca dosya boyutunuzun platform sınırlarını aşmadığını doğrulayın.
SpeechGen, oluşturulan ses dosyalarımı ne kadar süreyle saklar?
Proje geçmişiniz 30 gün boyunca otomatik olarak kaydedilir. Akıllı önbellek (cümle düzeyinde tasarruflar için) 7 gün sürer. Dosyaları kalıcı olarak saklamak için favorilerinize ekleyin. Bu, önemli ses projelerinizin asla kaybolmamasını ve profilinizde erişilebilir kalmasını sağlar.
Tek bir ses dosyasında farklı karakterler için farklı sesler kullanabilir miyim?
Evet! SpeechGen, çoklu ses üretimi (diyalog modu) sunar. Farklı metin bölümlerine farklı sesler atayabilirsiniz, bu da onu birden fazla karakter içeren sesli kitaplar, eğitim diyalogları veya birden fazla konuşmacıya sahip podcast'ler için mükemmel kılar. Karakter tutarlılığını korurken diller arasında geçiş yapmak için çok dilli sesleri bile kullanabilirsiniz.
SpeechGen'deki normal ve PRO sesler arasındaki fark nedir?
PRO sesler, normal seslere kıyasla üstün kalite ve doğallık sunar. Genellikle daha iyi duygusal ifadeye, daha doğru telaffuza sahiptirler ve bazıları entonasyon grafikleri gibi gelişmiş özellikleri destekler. Sesli kitaplar, kurslar veya iş sunumları gibi profesyonel projeler için PRO sesler önerilir.
Ses ayarlarını değiştirmek karakter limitlerimi tüketir mi?
Hangi ayarları değiştirdiğinize bağlıdır. Konuşma hızını veya perdesini ayarlamak tam yeniden oluşturma gerektirir ve bu değişiklikler tüm ses sentezini etkilediği için karakter limitlerinizi tüketir. Ancak, cümleler ve paragraflar arasındaki duraklamaları herhangi bir limit tüketimi olmadan serbestçe değiştirebilirsiniz. Ayrıca, SpeechGen akıllı önbellekleme kullanır: büyük bir metin oluşturup ardından yalnızca bir cümleyi düzenleyip yeniden oluşturursanız, sistem yalnızca o tek değişen cümle için ücretlendirilir, tüm metin için değil. Bu önbellekleme sistemi, değişmeyen cümlelerinizi 7 gün boyunca saklar, bu da artımlı düzenlemeyi çok ekonomik hale getirir.
Video
Hala Sorularınız mı Var?
Topluluğumuzdan yardım alın! Sorularınızı Telegram sohbetimizde sorun: https://t.me/speechgen