VALL E
Microsoft tarafından geliştirilmiş bir yapay zekadır. Duygusal tonlamaları dahi verebilen gerçekçi insan konuşmaları sentezleyebilmektedir.
VALL E hakkında
VALL E, karmaşık yapay zeka algoritmaları içeren çevrimiçi bir Windows hizmetidir. Yüksek kaliteli ses taklitleri oluşturmanızı sağlar. 7000’den fazla İngilizce konuşan kişiden alınan konuşma örnekleri üzerinde eğitilmiş bir model ile çalışmaktadır.
Ses üretimi
Bu yapay zeka, geleneksel programlara kıyasla tamamen farklı konuşma sentezleme yöntemleri kullanmaktadır. Algoritma, tını ve duygusal tonlar gibi ince ses özelliklerini fark edebilmektedir. Bu sayede yalnızca üç saniyelik bir ses parçasını işledikten sonra o ses üzerinden bir kişiyi taklit edebilmektedir.
Resmi web sitesinde yapay zekanın ürettiği bazı örnekleri bulabilirsiniz. Site üzerinden ses parçalarını dinleyip bunları geleneksel konuşma sentezleyicilerle karşılaştırabilirsiniz. Yine bu çevrimiçi veritabanında farklı duygusal tonlarda ses örnekleri de bulunmaktadır. Yapay zeka aynı cümleyi sevinç, öfke, tiksinti gibi duyguları taklit ederek dile getirebilmiştir.
Test dönemi
Stable Diffusion yapay zekasının aksine VALL E algoritmasının kaynak kodu henüz genele açık değil veya bir hizmet olarak kullanıma sunulmamıştır. Bu nedenle kendi ses parçalarınızı yükleyip ses sentezi yapamazsınız. Ayrıca algoritmanın açık kaynak kodlu dağıtılmamasının temel sebeplerinden birisi bu yapay sinir ağının art niyetle kullanıma açık olmasından kaynaklanmaktadır.
Özellikler
- Programı indirmek ve kullanmak ücretsiz.
- Gerçek insanların konuşma kalıpları üzerinde eğitilmiş bir yapay zeka.
- Sesin tınısını ve duygusal tonunu algılar.
- Kaynak kodu güvenlik sebebiyle paylaşılmamakta.
- Modern Windows sürümleriyle uyumlu.