1930’dan Sonrasını Bilmeyen “Cahil” Yapay Zekâ Geliştirildi: İnterneti, iPhone’u, Toplumsal Medyayı Bilmiyor

1930’dan Sonrasını Bilmeyen “Cahil” Yapay Zekâ Geliştirildi: İnterneti, iPhone’u, Toplumsal Medyayı Bilmiyor

Yapay zekâ modelleri genelde ne kadar aktüel bilgiye sahip olduklarıyla gündeme geliyor. Fakat bu sefer durum biraz farklı. Araştırmacılar, çağdaş dünyayı bilmemesi için özel olarak tasarlanmış bir yapay zekâ modeli geliştirdi. Yani bu model teorik olarak interneti, iPhone’u, YouTube’u yahut toplumsal medyayı bilmiyor.

İçerikten Görseller

×

+ −

‹ ›

Talkie ismi verilen bu model, Nick Levine, David Duvenaud ve Alec Radford tarafından tanıtıldı. 13 milyar parametreli yapay zekâ, 1931 öncesine ilişkin İngilizce metinlerle eğitildi. Bu yüzden ona “1930’dan gelmiş üzere konuşan yapay zekâ” demek pek de yanlış olmaz.

İçerikten Görseller

×

+ −

‹ ›

Talkie, çağdaş internet yerine eski kitaplarla eğitildi

SORU: 2026 yılında “akıllı telefon” isminde bir tüketici teknolojisi eseri hangi özelliklere sahip olurdu?

Talkie-1930: Elde tutulan küçük yuvarlak bir kutu biçiminde, bir vericisi ve kulak biçimine misal bir alıcısı olurdu. Kutunun içinde bir diyafram bulunur ve buna bir ağızlık takılı olurdu. Tüm aygıt yaklaşık bir kol saati büyüklüğünde olurdu. Alıcı bir kancaya asılır ve onunla verici ortasındaki temas esnek bir kablo aracılığıyla sağlanırdı. Akıllı telefon temel olarak şahsî irtibat için kullanılırdı ve konuşmacının, aygıttan yaklaşık elli fit uzaklıktaki bir odada sesini duyurmasını sağlardı. Günlük konuşma tonunu koruyarak ses tekrar üretilirdi. Akıllı telefon, sağır bireyler için ve ayrıyeten konuşmacıların ile aktörlerin bir binanın her köşesinde kendilerini net biçimde söz edebilmeleri açısından büyük yarar sağlardı. Ayrıyeten askeri operasyonlarda da faydalı olur, generallerin kurmay subaylarıyla kolay kolay irtibat kurmalarını mümkün kılardı.

Siz de denemek isterseniz buraya tıklayabilirsiniz.

Talkie’nin eğitiminde kitaplar, gazeteler, mecmualar, bilimsel yayınlar, patentler ve hukuk metinleri kullanıldı. Toplam eğitim verisinin 260 milyar token olduğu açıklandı. Yani model, bugünkü internet bilgileri yerine büyük ölçüde tarihî arşivlerden beslenmiş durumda.

Araştırmacılar bilhassa 1930 yılını seçti zira bu devirden evvel yayımlanan birçok İngilizce eser kamu malı kapsamına giriyor. Böylelikle model, günümüz web siteleriyle değil; eski dünyanın lisanı, bilgisi ve bakış açısıyla eğitilmiş oluyor.

Amaç yalnızca “geçmişten biriyle konuşmak” değil

İlk bakışta bu proje kulağa eğlenceli bir deney üzere geliyor. Sonuçta çağdaş dünyayı bilmeyen bir yapay zekâya “iPhone nedir?” diye sormak oldukça değişik olabilir. Lakin Talkie’nin asıl geliştirilme nedeni bundan çok daha önemli.

Araştırmacılar, Talkie ile yapay zekâ modellerinin bilgiyi nasıl öğrendiğini, nasıl genelleme yaptığını ve eğitim verisindeki sızıntılardan nasıl etkilendiğini incelemek istiyor. Yani bu model, “cahil” olduğu için değil; denetimli biçimde geçmişte bırakıldığı için pahalı.

Modelin iki farklı sürümü var

Talkie’nin temel sürümü talkie-1930-13b-base ismiyle yayımlandı. Bu sürüm, 1931 öncesi metinlerle eğitilen ana model olarak karşımıza çıkıyor. Bir de kullanıcılarla daha doğal sohbet edebilmesi için hazırlanan talkie-1930-13b-it sürümü bulunuyor.

Sohbet odaklı sürüm; eski görgü kuralları kitapları, ansiklopediler, mektup yazma kılavuzları ve gibisi kaynaklardan çıkarılan örneklerle eğitildi. Böylelikle model, yalnızca tarihî bilgiye sahip olmakla kalmıyor, tıpkı vakitte sorulara daha anlaşılır karşılıklar verebiliyor.

Yine de çağdaş dünyadan büsbütün habersiz değil

İşin değişik tarafı, Talkie’nin 1930 sonrasını hiç bilmemesi gerekirken kimi çağdaş tarih bilgilerine ulaşabildiği görülmüş. Bunun nedeni ise veri sızıntısı. Yani yanlış tarihli metinler, sonradan eklenen notlar yahut çağdaş açıklamalar eski bilgi setinin içine karışmış durumda.

Araştırmacılar, evvelki Talkie sürümünün Franklin D. Roosevelt ve New Deal üzere 1930 sonrası hususlarda bilgi sahibi olabildiğini söylüyor. 13 milyar parametreli yeni sürümde de II. Dünya Savaşı, Birleşmiş Milletler ve Almanya’nın bölünmesi üzere kimi bilgiler ortaya çıkabiliyor.

Eski metinleri yapay zekâya okutmak pek kolay değil

Talkie projesindeki en büyük sıkıntılardan biri, eski metinlerin bilgisayar ortamına aktarılması. Zira 1930 öncesi kaynakların büyük kısmı dijital olarak doğmadı. Kitapların, gazetelerin ve evrakların taranıp metne çevrilmesi gerekiyor.

Bu noktada OCR ismi verilen metin tanıma teknolojileri devreye giriyor. Lakin eski sayfa nizamları, yıpranmış baskılar ve düşük kaliteli taramalar nedeniyle bu sistemler yanılgı yapabiliyor. Araştırmacılar da bu yüzden tarihî metinleri daha hakikat okuyabilecek özel sistemler üzerinde çalışıyor.

Talkie açık kaynak olarak kullanılabiliyor

Talkie sırf kapalı kapılar arkasında test edilen bir araştırma projesi değil. Model, GitHub ve Hugging Face üzerinden geliştiricilerin erişimine açılmış durumda. Yani kâfi donanıma sahip olan kullanıcılar modeli indirip deneyebiliyor.

Tabii bunun için sıradan bir bilgisayar pek kâfi değil. Modeli çalıştırmak için Python, PyTorch ve CUDA dayanaklı güçlü bir ekran kartı gerekiyor. Ayrıyeten model belgeleri da epeyce büyük; bu yüzden Talkie daha çok geliştiricilere ve araştırmacılara hitap ediyor.

Daha büyük bir “geçmiş yapay zekâsı” da yolda

Araştırmacılar, Talkie’nin şu anda bildikleri en büyük “vintage” lisan modeli olduğunu söylüyor. Lakin proje burada bitmeyecek. Takım, GPT-3 düzeyine yaklaşan daha büyük bir model üzerinde de çalıştıklarını açıkladı.

Gelecekte tarihî metin havuzunun 1 trilyon tokenın üzerine çıkarılması hedefleniyor. Bu gerçekleşirse çağdaş dünyayı bilmeyen lakin çok daha güçlü bir yapay zekâ modeliyle karşılaşabiliriz. Yani bir gün nitekim “1930’lardan gelmiş” üzere konuşan dev bir yapay zekâ görebiliriz.

Kaynak : Webtekno

Yazar Profil Fotoğrafı

Serhat ÖZTÜRK

MotorcularMekani.Com İle Sohbete Katıl Sohbetin en sıcak, dostluğun en gerçek hali MotorcularMekani.Com’da seni bekliyor. Sen de hemen katıl, online sohbet sitesi deneyimini özgürce yaşa ve muhabbetin keyfini çıkar!

İlk yorum yazan siz olun.

Cevap bırakın
Gerekli alanlar işaretlenmiştir. *