SpeechGen.io'da Metni Konuşmaya Nasıl Dönüştürülür: Kapsamlı Rehber

08-09-2025 , 16-09-2025

🚀 Hızlı Başlangıç — 4 Adımda Ses Oluşturun

Adım 1: Dil Seçin

Dil açılır menüsünü açın ve metninizin dilini seçin. Desteklenen diller: 150'den fazla dil (Yapay zeka sesleri kütüphanesi).

Adım 2: Ses Seçin

Dili seçtikten sonra bir ses listesi görünecektir. Örnekleri dinleyin ve favorinizi seçin

Adım 3: Metni Yapıştırın

Metninizi metin kutusuna kopyalayın veya bir dosya yükleyin (DOCX, PDF). Altyazıları konuşmaya dönüştürmek için özel SRT'den Sese sayfayı kullanın.

Adım 4: "Konuşma Oluştur" (mavi düğme) düğmesine tıklayın

Adım 4: Konuşma Oluştur düğmesine tıklayın

İşlenmesini bekleyin ve hazır ses dosyanızı indirin

İşte bu kadar! İlk seslendirmeniz sadece birkaç dakika içinde hazır.

Metin Hazırlığı

Önerilenler:

Gereksiz semboller olmadan düz metin kullanın
Noktalama işaretlerini (nokta, virgül, ünlem) doğru yerleştirin
Uzun metinleri paragraflara bölün

Kaçınılması Gerekenler:

Emojiler ve ifadeler (ses üretimini bozabilir)
Egzotik semboller: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
Özel Unicode sembolleri:

💡 İpucu: PDF dosyalarından kopyalarken metne özellikle dikkat edin — ses kalitesini bozabilecek görünmez karakterler görünebilir!

Sınırlar ve Kısıtlamalar

Desteklenen diller: 150'den fazla dil (tam liste).
Yükleme formatları: düz metin, DOCX, PDF, SRT.

Tek seferde maksimum: 2.000.000 karakter (≈ 285.000-330.000 kelime) - bu, tek bir üretimde konuşmaya dönüştürebileceğiniz etkileyici bir metin miktarıdır, bu da onu tüm kitaplar veya kapsamlı belgeler gibi uzun biçimli içerikler için ideal hale getirir.

Detaylı Adım Adım Talimatlar

Adım 1: Metin Yükleme

Metni yapıştırın: Metninizi metin kutusuna kopyalayın
Dosya yükleyin: Veya yükleme düğmesine tıklayın ve bir dosya seçin (DOCX, PDF)
Metni kontrol edin: Metnin doğru görüntülendiğinden emin olun

Adım 2: Dil Seçimi

⚠️ Önemli: Önce metniniz için doğru dili seçin

Dil açılır listesini açın
İhtiyacınız olan dili bulun (150'den fazla dil mevcut)
Çok dilli metinler için çoklu ses üretimi kullanın

Adım 3: Ses Seçimi

Dili seçtikten sonra, mevcut seslerin bir listesi açılacaktır. İhtiyaçlarınıza en uygun olanı bulmak için her sesin oynat düğmesine tıklayarak örnekleri dinleyin. Farklı ses türleri mevcuttur: Normal sesler standart kalite sunar, PRO sesler geliştirilmiş kalite ve doğallık sağlar ve Çok dilli sesler (Ava_US, Ava_ES gibi dil kodlarıyla işaretlenmiş) farklı dillerde ses tutarlılığını korumanıza olanak tanır. Ton, duygu ve karakter açısından önemli ölçüde farklılık gösterdikleri için her sesi önizlemek için zaman ayırın.

Adım 4: Parametreleri Yapılandırma

Konuşma hızı: x0.1 (çok yavaş) ile x2.2 (çok hızlı) arası
Ses perdesi: -20 ile +20 arası (2'lik adımlarla)

Metin kutusunun altında, oluşturma düğmesinin üzerinde duraklama ayarlarını yapabilirsiniz:

duraklama ayarları

Cümleler arası duraklamalar: 150ms - 30 saniye
Paragraflar arası duraklamalar: 150ms - 30 saniye

Adım 5: Konuşma Oluşturma

Dönüştürme işlemini başlatmak için metin kutusunun altındaki "Konuşma Oluştur" düğmesine tıklayın. İşlem süresi metin uzunluğunuza bağlıdır - daha kısa metinler saniyeler içinde tamamlanırken, daha uzun belgeler birkaç dakika sürebilir. Oluşturma tamamlandıktan sonra, beklentilerinizi karşıladığından emin olmak için sonucu doğrudan tarayıcıda dinleyebilirsiniz.

Adım 6: İndirme

Oluşturma tamamlandıktan sonra bir "İndir" düğmesi görünecektir. Varsayılan olarak dosyayı MP3 olarak indirebilirsiniz. Ancak, farklı bir format (WAV veya OPUS) istiyorsanız veya ses kalitesini değiştirmek istiyorsanız (8000 ila 44000 Hz arası örnekleme hızı), önce bu seçenekleri açılır menülerden seçmeniz, konuşmayı seçtiğiniz ayarlarla yeniden oluşturmanız ve ardından dosyayı tercih ettiğiniz özelliklerle indirmeniz gerekir.

Ses Parametre Ayarları

Konuşma Hızı

Hız ölçeği:

x0.1 - x0.9: Yavaşlatma (karmaşık materyaller, dil öğrenimi için)
x1.0: Normal hız (varsayılan)
x1.1 - x2.2: Hızlandırma (dinamik içerikler için)

Bu ölçeğin nedeni: 1'den küçük kesirli değerler konuşmayı yavaşlatır, 1'den büyük değerler hızlandırır. Bu, dinleyiciniz için hassas tempo seçimi sağlar.

Hız önerileri:

Eğitim: x0.8-x1.0 (daha iyi anlaşılabilirlik için)
Sunumlar: x0.9-x1.1 (resmi tempo)
Podcast'ler: x1.0-x1.2 (canlı tempo)
YouTube: x1.1-x1.4 (dikkat çekme)

Ses Perdesi

Perde aralığı: -20 ile +20 arası, 2'lik adımlarla

Neden 2'lik adım: 2 birimlik bir adım, fark edilebilir ancak keskin olmayan bir perde değişikliği sağlar. Daha küçük adımlar fark edilmez, daha büyük adımlar ise çok dramatik olur.

Perde etkisi:

Negatif değerler (-2 ila -20): Sesi daha alçak, daha ciddi, otoriter yapar
Pozitif değerler (+2 ila +20): Sesi daha yüksek, daha samimi, daha enerjik yapar
0: Nötr perde (varsayılan)

Uygulamalar:

İş içerikleri: -4 ila +2
Çocuk içerikleri: +4 ila +12
Dramatik içerikler: -8 ila -16
Samimi içerikler: +2 ila +8

Duraklamalarla Çalışma

Otomatik Duraklamalar

Cümleler arası duraklamalar: 300ms (varsayılan)

Paragraflar arası duraklamalar: 400ms (varsayılan)

Bu ayarlar 150ms ile 30 saniye arasında açılır menülerden değiştirilebilir.

Manuel Duraklama Ekleme

Arayüz aracılığıyla:

İmleci metindeki istediğiniz konuma yerleştirin
Menüdeki "Duraklama" düğmesine tıklayın
Metinde .- sembolü görünecektir

Etiketler aracılığıyla:

İstediğiniz konuma <break time="200ms"/> veya <break time="2s"/> etiketini ekleyin

Duraklama kuralları:

Maksimum duraklama: 30 saniye
Daha uzun gecikme için art arda birden fazla duraklama yerleştirebilirsiniz
Duraklamalar ek limit tüketmez

Duraklamalar ne zaman kullanılır:

Önemli ifadelerden önce
Retorik sorulardan sonra
Farklı konular arasında
Dramatik etki yaratmak için

Çoklu Seslendirme

Bu diyalog özelliği, tek bir metinde farklı sesler kullanmanıza olanak tanır.

Uygulamalar:

Sesli kitaplar: Karakterler için farklı sesler
Eğitim diyalogları: Öğretmen ve öğrenci
Sunumlar: Ana konuşmacı ve yorumcu
Podcast'ler: Birden fazla sunucu

Çoklu seslendirme özelliği, karakter seslerinin ötesinde yaratıcı olanaklar sunar. Örneğin, yabancı dil öğretmenleri, dil öğrenimi için aynı ifadeyi farklı hızlarda göstermek amacıyla bu özelliği kullanarak öğrencilerin farklı anlama seviyelerinde telaffuzu kavramalarına yardımcı olabilirler. Detaylı teknikler ve sınıf uygulamaları için, yabancı dil öğretimi için metinden sese kullanma konusundaki rehberimize bakın: yabancı dil öğretimi için metinden sese kullanma.

Ses Seçimi

Çok Dilli Sesler

Dil kodlarına sahip sesler (örneğin, Ava_US, Ava_ES, Ava_DE), farklı dillerde tutarlı ses tanıma sağlamak üzere tasarlanmıştır. Bu çok dilli sesler, çok dilli içerikler için birleşik bir stil oluşturmanıza olanak tanır ve aynı ses karakterinin birden fazla dili sorunsuz bir şekilde konuşabilmesini sağlar. Bu özellik, özellikle diyalog modunda, ses projeniz boyunca aynı tanınabilir ses kişiliğini korurken diller arasında geçiş yapmanıza olanak tanır.

Ses Segmentasyonu

SpeechGen, tek bir sentez projesi içinde sesinizi birden fazla segmente ayırmanıza olanak tanır, bu da onu farklı sahneler veya bölümler için ayrı ses dosyalarına ihtiyaç duyan video editörleri için mükemmel kılar. Bu özellik, YouTube videoları, çevrimiçi kurslar veya hassas ses senkronizasyonu gerektiren herhangi bir proje için seslendirmeler oluşturmak üzere özellikle kullanışlıdır.

Segment Oluşturma

Sesinizi bölmek için imlecinizi bölmek istediğiniz yere yerleştirin ve menü panelindeki kesme düğmesine tıklayın. Bu, o konuma bir <cut/> etiketi ekler. Bu etiketi metniniz boyunca manuel olarak da yazabilir veya kopyalayıp yapıştırabilirsiniz. Özel dosya adları için şu formatı kullanın:

<cut name="dosya-adiniz"/>

Bu özellik, anlamlı adlarla segmentleri düzenlemenize yardımcı olur:

<cut name="giris"/>

<cut name="bolum-1"/>

Segmentleri İndirme ve Yönetme

En az bir segment etiketi ekledikten sonra, oluşturma sonrasında bir "segmentleri indir" düğmesi görünür. Tüm segmentleri tek seferde indirmek için tıklayın veya bireysel segmentlere erişmek için ses oynatıcısındaki "daha fazla" düğmesini kullanın. Her dosya otomatik olarak benzersiz bir kimlik, sıra numarası ve açıklayıcı başlık ile adlandırılır (örneğin, "7054789_1_ilk-cumle"), bu da ses dosyalarınızı düzenleme yazılımınızda tanımlamayı ve organize etmeyi kolaylaştırır.

Segment Sınırlamaları

Kısa segmentler: Üretim başına 1000 segmente kadar
Uzun segmentler: Üretim başına 500 segmente kadar

Daha büyük projeler için birden fazla üretime bölün. Kapsamlı talimatlar, gelişmiş teknikler ve video eğitimleri için tam ses segmentasyonu belgelerimize bakın.

Entonasyon Ayarı

Bazı seslerde entonasyon grafikleri bulunur:

Entonasyon grafikleri, ses adının yanında bir ayarlar simgesi gösteren seslerde mevcuttur - bu özellik, hem normal hem de PRO seçenekleri dahil olmak üzere kütüphanedeki seslerin yarısından fazlasında bulunur

Entonasyonu değiştirmek için grafikteki noktaları sürükleyin
Belirli kelimelerdeki perdeyi artırmak için noktaları yükseltin
Daha ciddi bir ton oluşturmak için noktaları indirin
Doğallık için farklı eğrilerle deney yapın

Entonasyonu değiştirmek için grafikteki noktaları sürükleyin

Entonasyonu ayarlamak istediğiniz cümleyi seçin ve entonasyon düğmesine basın. Bu arayüz görünecektir.

Önbellekleme Sistemi ve Limit Tasarrufu

Akıllı Önbellek

SpeechGen.io, limitlerinizi önemli ölçüde tasarruf sağlayan akıllı bir önbellekleme sistemi kullanır. Sistem, her cümleyi (100.000 karaktere kadar) 7 gün boyunca önbellekte saklayarak çalışır. Sesinizi yeniden oluşturduğunuzda, değişmeyen cümleler otomatik olarak ücretsiz olarak önbellekten alınır - yalnızca yeni veya düzenlenmiş cümleler için ödeme yaparsınız. Bu, karakter limitinizi her seferinde tüketmeden metninizde artımlı düzenlemeler yapabileceğiniz anlamına gelir. Proje geçmişi 30 gün boyunca saklanır ve favorilerinize eklediğiniz dosyalar kalıcı olarak tutulur.

Saklama süreleri:

Cümle önbelleği: 7 gün
Proje geçmişi: 30 gün
Favori dosyalar: Kalıcı olarak saklanır

Yaygın Sorun Giderme

Ses Kalitesi Sorunları

Ses doğal gelmiyor:

PRO sesleri deneyin
Hızı x0.9-x1.1'e düşürün
Noktalama doğruluğunu kontrol edin
Nötr perde (0) kullanın

Yanlış telaffuz:

Doğru dilin seçildiğinden emin olun
Karmaşık kelimeleri fonetik olarak yazın
Hassas kontrol için SSML etiketlerini kullanın

Doğal olmayan duraklamalar:

Noktalama işaretlerini kontrol edin
Cümleler arası duraklamaları yapılandırın
Manuel duraklamaları .- veya <break time=""/> kullanın
Fazladan boşlukları ve satır sonlarını kaldırın

SSML hataları:

Etiket doğruluğunu kontrol edin
Tüm sesler tüm SSML etiketlerini desteklemez

Ek Özellikler

SSML (Speech Synthesis Markup Language)

Uzman ses kontrolü için SSML etiketlerini kullanın:

<break time="2s"/> — duraklamalar
<emphasis level="strong"> — ses vurgusu
<prosody rate="slow" pitch="low"> — konuşma özellikleri değişikliği

⚠️ Dikkat: Farklı sesler farklı SSML etiket setlerini destekler. Her belirli ses için işlevselliği test edin.

Geçmiş ve Favoriler

Proje geçmişi: 30 gün boyunca otomatik olarak kaydedilir
Favoriler: Önemli projeleri kalıcı depolama için ekleyin

Entegrasyon ve API

API, geliştiricilerin SpeechGen.io'yu kendi uygulamalarına ve hizmetlerine entegre etmeleri için mevcuttur.

Dosyam SpeechGen'e yüklenmiyor. Ne yapmalıyım?

Öncelikle, dosyanızın desteklenen bir formatta (DOCX, PDF veya TXT) olduğundan emin olun. Dosyanın bozuk olmadığından emin olun ve tekrar yüklemeyi deneyin. Sorun devam ederse, metni manuel olarak kopyalayıp doğrudan metin kutusuna yapıştırın. Ayrıca dosya boyutunuzun platform sınırlarını aşmadığını doğrulayın.

SpeechGen, oluşturulan ses dosyalarımı ne kadar süreyle saklar?

Proje geçmişiniz 30 gün boyunca otomatik olarak kaydedilir. Akıllı önbellek (cümle düzeyinde tasarruflar için) 7 gün sürer. Dosyaları kalıcı olarak saklamak için favorilerinize ekleyin. Bu, önemli ses projelerinizin asla kaybolmamasını ve profilinizde erişilebilir kalmasını sağlar.

Tek bir ses dosyasında farklı karakterler için farklı sesler kullanabilir miyim?

Evet! SpeechGen, çoklu ses üretimi (diyalog modu) sunar. Farklı metin bölümlerine farklı sesler atayabilirsiniz, bu da onu birden fazla karakter içeren sesli kitaplar, eğitim diyalogları veya birden fazla konuşmacıya sahip podcast'ler için mükemmel kılar. Karakter tutarlılığını korurken diller arasında geçiş yapmak için çok dilli sesleri bile kullanabilirsiniz.

SpeechGen'deki normal ve PRO sesler arasındaki fark nedir?

PRO sesler, normal seslere kıyasla üstün kalite ve doğallık sunar. Genellikle daha iyi duygusal ifadeye, daha doğru telaffuza sahiptirler ve bazıları entonasyon grafikleri gibi gelişmiş özellikleri destekler. Sesli kitaplar, kurslar veya iş sunumları gibi profesyonel projeler için PRO sesler önerilir.

Ses ayarlarını değiştirmek karakter limitlerimi tüketir mi?

Hangi ayarları değiştirdiğinize bağlıdır. Konuşma hızını veya perdesini ayarlamak tam yeniden oluşturma gerektirir ve bu değişiklikler tüm ses sentezini etkilediği için karakter limitlerinizi tüketir. Ancak, cümleler ve paragraflar arasındaki duraklamaları herhangi bir limit tüketimi olmadan serbestçe değiştirebilirsiniz. Ayrıca, SpeechGen akıllı önbellekleme kullanır: büyük bir metin oluşturup ardından yalnızca bir cümleyi düzenleyip yeniden oluşturursanız, sistem yalnızca o tek değişen cümle için ücretlendirilir, tüm metin için değil. Bu önbellekleme sistemi, değişmeyen cümlelerinizi 7 gün boyunca saklar, bu da artımlı düzenlemeyi çok ekonomik hale getirir.

Video

Hala Sorularınız mı Var?

Topluluğumuzdan yardım alın! Sorularınızı Telegram sohbetimizde sorun: https://t.me/speechgen