
Facebook, Instagram ve WhatsApp üzere dünyanın en çok kullanılan uygulamalarının sahibi olan Meta, yapay zekâ konusunda da öne çıkan firmalardan biriydi. ABD’li teknoloji devi, dün yaptığı açıklamayla Omnilingual ASR ismini verdiği yepisyeni bir yapay zekâ modelini bizlerle buluşturduğunu duyurdu.
Yeni yapay zekâ modeli, dili yazıya dökebilen bir otomatik konuşma tanıma sistemi olarak geliyor ve şimdiye kadar bu husustaki en uygun yapay zekâlardan biri olarak nitelendiriliyor. O denli ki model, toplamda 1600’dan fazla dili manaya yeteneğine sahip.
Dünyadaki lisan bariyerini ortadan kaldırmayı amaçlıyor

Şimdiye kadar piyasaya sürülen konuşma tanıma araçlarının birçoklarında birkaç yüz lisana takviye sunuluyordu. Lakin Omnilingual ASR isimli model, buna âdeta çağ atlatarak dayanağını 1600’den fazla lisana getirdi. Dünyada 7000’i aşkın konuşulan lisan bulunuyor. Büyük bir çoğunluğuna yapay zekâ modellerinin dayanağı yoktu. Açığı kapatmada büyük bir adım olduğu için Meta’nın yeni modelinin değerli olduğunu söyleyebiliriz.
Meta’nın açıklamalarına göe desteklenen 1600’den fazla lisandan 500’ü şimdiye kadar hiçbir yapay zekâ sistemi tarafından desteklenmedi. Global dil mahzurlarını ortadan kaldırmaya yardımcı olabileceği, “evrensel bir transkripsiyon sistemi” misyonu görebileceği aktarıldı.
Modelin gerçek sonuçlar vermesi, eğitim bilgilerine bağlı olacak. Test edilen 1600 lisanın %78’inde** %10’un altında yanılgı oranı** varmış. En az 10 saatlik eğitim ses içeriğine sahip lisanların %95’inde bu düzeylere ulaşılabilmiş. Daha da kıymetlisi ise “kendi lisanını getir” özelliği. Bu özellik sayesinde kullanıcılar, ses ve metin örneği sağlayarak yeni lisanlar ekleme imkânına sahip olacak. Model, bu örnekleri kullanarak lisanlara takviye sunabilecek. Natürel ki ne kadar çok bilgi o kadar çok muvaffakiyet oranı demek. Meta, bu teknikle ASR’nin takviyesinin 5400 lisana kadar çıkabileceğini öngörüyor. Böylelikle çok az konuşulan lisanlara bile yapay zekâ takviyesi sağlanabilir.
Omnilingual ASR’nin açık kaynaklı olduğunu da eklemeden geçmemek gerek. Böylelikle araştırmacılar ve geliştiriciler, ticari kullanım da dahil olmak üzere modelleri özgürce kullanma, değiştirme ve kendi uygulamalarını geliştirme imkânına sahip olacak. ASR ailesinin 300 milyon ila 7 milyar ortası değişen modellerden oluştuğunu belirtelim. Yani her düzeye uygun olarak geliyorlar. Bir demosuna buradan ulaşabilirsiniz.
Webtekno
İlk yorum yazan siz olun.