Microsoft Gerçek Ses Taklidi Edebilecek Yapay Zeka Uygulaması Geliştirdi

Yapay zeka uygulama üretimine kolları sıvayan Microsoft, 2022'nin sonlarına doğru yapay zeka sayesinde ses taklidi yapabilen bir uygulama geliştirdi. VALL-E ismi verilen bu uygulama ile bir kişiden alınan 3 saniyelik bir ses kaydı ile o kişinin ses taklidi yapmak çok kolay.

TTS olarak bilinen metinden konuşmaya dil modeline Nöral Codec Dil Modeli olarak yeni bir modelleme geliştirildi. Bu dil modellemeleri sayesinde ses takliti çok kolaylaşıyor. VALL-E, yapılan testlerde konuşma doğallık ve konuşmacı benzerlikleri açısından çok iyi performans göstermektedir. Ayrıca VALL-E duygu ve akustik becerisi ile ortam ambiansı ile taklit başarılı bir şekilde gerçekleşmiştir.

Uzman Kaygıları

Sadece belli ve ne olduğunu bilen kişiler arasında yapılan testler başarılı fakat bunun birde Dünya genelinde kullanılması gerçek bir problem doğurma olasılığı vardır. Bu olasılıkları düşünen Microsoft etik olarak bu uygulamayı kötüye kullanılma potansiyeli olduğundan risklerden de bahsetmiştir. Konuşmacılar için bir protokol ve her konuşmacı için bir algılama modeli olmasını belirtmişlerdir.

VALL-E henüz github'ta bir sayfada örneklerle anlatılmış olsada bir gün hayatımıza girmesi olağan.
VALL-E örneklerini dinlemek isterseniz.Buraya tıklayarak adrese gidebilir ve tüm duygu ve bilinçsel örnekleri dinleyebilirsiniz.

Sizce yapay zeka daha fazla ne kadar ileriye gidebilir? Neler olması muhtemel?

Yorum Gönder

Konu hakkında düşüncelerinizi hemen yorum yaparak belirtebilirsiniz.