
Nvidia, fizikî yapay zeka alanına yönelik geliştirdiği yeni temel modeli Cosmos 3‘ü duyurdu. Şirketin açıklamasına nazaran Cosmos 3, yerleşik görsel akıl yürütme yetenekleriyle birlikte metin, imaj, görüntü, ortam sesleri ve hareket üretimini tek çatı altında birleştiren dünyanın birinci büsbütün açık omnimodeli olarak öne çıkıyor. Model, robotlar, otonom araçlar ve görsel yapay zeka sistemlerinin geliştirilme süreçlerini hızlandırmayı hedefliyor.
Computex 2026’nın çabucak öncesinde Nvidia’nın GTC Taipei etkinliğinde tanıtılan Cosmos 3, fizikî dünyayı anlayabilen, gelecekteki durumları kestirim edebilen ve çeşitli misyonlar için aksiyon planları oluşturabilen bir sistem olarak tasarlandı. Şirket, modelin fizikî yapay zeka eğitim ve kıymetlendirme süreçlerini aylar yerine günler düzeyine indirebildiğini belirtiyor.
Farklı yetenekler tek sistemde birleşiyor
Cosmos 3’ün merkezinde, Nvidia’nın “Mixture of Transformers” (MoT) olarak isimlendirdiği yeni bir mimari bulunuyor. Daha evvel dünya modeli oluşturma, fizikî ortamları manaya ve denetimli sahne üretimi üzere misyonlar farklı sistemlerde yürütülürken Cosmos 3, bu yetenekleri tek bir yapı altında topluyor.
Model, bir yandan akıl yürütme süreçlerini gerçekleştiren bir transformer katmanı, öteki yandan içerik üretimi yapan uzman bir üretim katmanından oluşuyor. Bu yapı sayesinde objeler ortasındaki etkileşimleri, hareketleri ve uzamsal-zamansal münasebetleri tahlil ettikten sonra görüntü içerikleri ve hareket senaryoları oluşturabiliyor. Otonom araçlara kadar uzanan kullanım alanı
Şirket, Cosmos 3’ün farklı kullanım senaryolarında misyon alabileceğini belirtiyor. Model, çoklu bilgi çeşitlerini anlayabilen bir görsel-dil modeli olarak kullanılabileceği üzere fizikî ortamları simüle eden bir dünya modeli yahut gelecekteki çevresel durumları öngörebilen bir görüntü temel modeli olarak da misyon yapabiliyor. Ayrıyeten robotların belli misyonları öğrenmesine yardımcı olan aksiyon modellerinin temelini oluşturabiliyor.
Cosmos 3’ün dikkat çeken özelliklerinden biri de saliseler düzeyinde gecikmeyle görsel akıl yürütme gerçekleştirebilmesi. Bunun yanında büyük ölçekli sentetik data üretimi ve robot öğrenme siyasetlerinin geliştirilmesi üzere alanlarda da kullanılabiliyor. Nvidia, modelin görüntüden görüntüye üretim konusunda da güçlü performans sergilediğini tabir ediyor. Şirket tarafından verilen örnekte sistem, Formula 1 yarışına ilişkin araç kamerası manzarasından yola çıkarak yüksek süratli yarış sahnelerini ve virajları içeren görüntüler oluşturabiliyor.
Super ve nano sürümleri yayında
Nvidia, Cosmos 3 ailesini farklı kullanım gereksinimlerine yönelik üç farklı sürümle şekillendiriyor. Hâlihazırda erişime açılan Cosmos 3 Super, robotik ve otonom araç modellerinin son eğitim basamaklarında kullanılmak üzere en yüksek fizik doğruluğu ve üretim kalitesini sunuyor. Cosmos 3 Nano ise çok daha düşük gecikme müddetlerinde görüntü ve aksiyon akıl yürütmesi gerçekleştirebiliyor. Gerçek vakitli uç aygıt çalıştırmalarına yönelik geliştirilen Cosmos 3 Edge sürümünün ise ilerleyen periyotta kullanıma sunulması planlanıyor.
Kaynak : Donanimhaber
İlk yorum yazan siz olun.