
Nvidia, yapay zeka altyapılarındaki bir sonraki büyük adım olarak gördüğü Vera Rubin platformunun tam üretim evresine geçtiğini duyurdu. Şirket, son devirde ortaya atılan gecikme tezlerini da fiilen boşa çıkarırken yeni platformun dünya genelinde milyarlarca dolarlık yapay zeka bilgi merkezlerine güç vermeye hazır olduğunu açıkladı.
Altı farklı çip, tek ekosistem
Rubin platformu toplam altı temel bileşenden oluşuyor. Bunlar 336 milyar transistörlü Rubin GPU, 227 milyar transistörlü Vera CPU, NVLink 6 ilişki anahtarı, ConnectX-9 ve BlueField-4 ağ tahlilleri ile Spectrum-X silikon fotonik altyapısı olarak sıralanıyor. Bu bileşenlerin tamamı DGX, HGX ve MGX sistemlerinde kullanılacak halde tasarlandı.
Sistemin merkezinde ise Nvidia’nın Vera Rubin Superchip ismini verdiği tahlil yer alıyor. Bu yapı içerisinde iki Rubin GPU ve bir Vera CPU bulunuyor. Ayrıyeten yüksek kapasiteli HBM4 ve LPDDR5X bellekler de sistemin temel kesimleri ortasında yer alıyor.
Blackwell’in çok ötesine geçilecek
Yeni Rubin GPU, yapay zeka iş yükleri için özel olarak tasarlandı. Yeni çip, 50 PFLOPS NVFP4 çıkarım performansı ve 35 PFLOPS NVFP4 eğitim performansı sunuyor. Nvidia’nın bilgilerine nazaran bu kıymetler Blackwell mimarisine kıyasla çıkarım tarafında 5 kat, eğitim tarafında ise 3,5 kat daha yüksek performans anlamına geliyor. Rubin GPU, çip başına 22 TB/s HBM4 bant genişliği sunarken evvelki kuşağa nazaran yaklaşık 2,8 kat daha yüksek data transfer kapasitesine ulaşıyor. Ayrıyeten GPU başına 3,6 TB/s NVLink bant genişliği sağlanıyor.
Platformun işlemci tarafında yer alan Vera CPU, Nvidia tarafından geliştirilen Olympus kod isimli özel Arm mimarisini temel alıyor. İşlemci, 88 çekirdek ve 176 iş parçacığı ile geliyor. Ayrıyeten 1,8 TB/s NVLink-C2C irtibat kapasitesi, 1,5 TB sistem belleği dayanağı ve 1,2 TB/s LPDDR5X bant genişliği sunuyor. Nvidia’ya nazaran Vera CPU, Grace işlemcilerine kıyasla bilgi sürece, sıkıştırma ve CI/CD iş yüklerinde yaklaşık iki kat performans artışı sağlıyor.
Yeni ağ ve irtibat teknolojileri de platformun parçası
Rubin mimarisinde bilgi transfer performansını artırmak için NVLink 6 teknolojisi kullanılıyor. Yeni kuşak irtibat altyapısı GPU başına 3,6 TB/s bant genişliği sağlarken, toplamda 28,8 TB/s data transfer kapasitesine ulaşabiliyor.
Ağ tarafında misyon yapan ConnectX-9 SuperNIC tahlili 800 Gb/s Ethernet dayanağı sunarken programlanabilir RDMA ve bilgi yolu hızlandırma özellikleriyle büyük ölçekli yapay zeka kümeleri için optimize edildi. BlueField-4 ise 64 çekirdekli Grace CPU ile birlikte geliyor ve evvelki kuşağa nazaran iki kat ağ performansı, altı kat süreç gücü ve üç kat bellek bant genişliği sağlıyor.
Şirket ayrıyeten Spectrum-X Ethernet Co-Packaged Optics tahlilini de duyurdu. 102,4 Tb/s ölçeklenebilir ağ altyapısı sunan teknoloji, silikon fotonik kullanımı sayesinde güç verimliliğini artırırken büyük ölçekli yapay zeka sistemlerinde daha yüksek güvenilirlik sağlamayı hedefliyor. Bu yıl müşterilere teslim edilecek
Nvidia’nın açıkladığı bilgilere nazaran Vera Rubin NVL72 sistemi, Blackwell NVL72 platformuna kıyasla kıymetli performans kazanımları sunuyor. Sistem, 3,6 EFLOPS çıkarım performansı ile 5 kat daha yüksek süreç gücü sağlarken, eğitim performansında da 2,5 EFLOPS düzeyine ulaşarak 3,5 kat artış sunuyor. Bunun yanında LPDDR5X kapasitesi 54 TB’a, HBM4 kapasitesi ise 20,7 TB’a çıkıyor. HBM4 bant genişliği 1,6 PB/s düzeyine ulaşırken, ölçeklendirme bant genişliği de 260 TB/s olarak belirtiliyor.
Nvidia, yeni platformun sırf performans artışı sağlamayacağını, tıpkı vakitte yapay zeka iktisadını de değiştireceğini savunuyor. Şirketin hesaplamalarına nazaran Rubin mimarisi, çıkarım süreçlerindeki token maliyetlerini 10 kat azaltabilecek. Ayrıyeten Mixture of Experts (MoE) modellerinin eğitimi için gereken GPU sayısının dört kat azaltılabileceği söz ediliyor.
Nvidia, Vera Rubin platformunun birinci sistemlerini bu yıl müşterilere teslim etmeyi planlıyor. Platformun hem DGX SuperPOD altyapılarında hem de daha geniş bilgi merkezi kurulumlarında kullanılması bekleniyor.
Kaynak : Donanimhaber
İlk yorum yazan siz olun.