
Çinli araştırmacılar, yapay zeka takviyeli görüntü üretiminde sürat ve maliyet istikrarını kökten değiştirmesi beklenen TurboDiffusion isimli yeni bir teknik geliştirdi. Kısa mühlet evvel yayımlanan akademik çalışmaya nazaran TurboDiffusion, manzara kalitesinden ödün vermeden video üretim sürecini ölçekli kullanımda 200 kata kadar hızlandırabiliyor.
Araştırma, Pekin’deki Tsinghua Üniversitesi, yapay zekâ modeli geliştiricisi Shengshu Technology ve Kaliforniya Üniversitesi Berkeley bünyesindeki uzmanların ortak çalışmasıyla hazırlandı. Çalışmada, TurboDiffusion’ın performansı tüketici sınıfı bir sistem üzerinde test edildi. Nvidia’nın RTX 5090’ın kullanıldığı bu testlerde, standart çözünürlükte beş saniyelik bir görüntü klibin üretim mühleti 3 dakikadan 1,9 saniyeye düşürüldü. Bu sonuç, yaklaşık 100 katlık bir sürat artışına karşılık geliyor.
Video üretiminde 200 kata varan hızlanma
Aynı donanım üzerinde gerçekleştirilen bir öbür deneyde ise yüksek çözünürlüklü, beş saniyelik bir görüntünün üretim mühleti neredeyse 80 dakikadan 24 saniyeye indirildi. Bu da TurboDiffusion’ın birtakım senaryolarda 200 kata yaklaşan bir sürat kazancı sağlayabildiğini ortaya koyuyor. OpenAI’ın metinden görüntüye dönüştürme modeli Sora, kısa klipler oluşturmak için birkaç dakikaya gereksinim duyuyor. Öbür emsal platformlarda da görüntü üretimi üç-beş dakika sürebiliyor.
Araştırmacılar, elde edilen bu çarpıcı hızlanmayı model eğitimi alanındaki yeniliklere bağlıyor. TurboDiffusion’da kullanılan ‘seyrek doğrusal dikkat mekanizması’ (sparse linear attention) yaklaşımı, yapay zeka modelinin tüm datayı tıpkı anda işlemek yerine sadece en kritik kısımlara odaklanmasını sağlıyor. Bu yol, hem süreç müddetini hem de hesaplama maliyetlerini önemli ölçüde azaltıyor.
Gerçek vakitli görüntü üretimine geçiş
Kesim analisti Kyon Xu, görüntü üretimindeki bu hızlanmanın büyük bir paradigma değişimine işaret ettiğini belirterek, yapay zeka görüntü modellerinin artık üretim sürecinde bir darboğaz olmaktan çıkacağını vurguluyor. Yapay zekanın farklı kesimlerde adil ve kapsayıcı biçimde yaygınlaşmasını hedefleyen AI Native Foundation da TurboDiffusion’a dikkat çekti. Vakıf, X platformunda yaptığı paylaşımda bu tekniğin “anında üretim” noktasına geçişi simgelediğini ve gerçek vakitli yapay zeka görüntü uygulamalarının önünü açtığını söz etti. Açıklamaya nazaran TurboDiffusion, şirketlerin daha düşük maliyetle, daha süratli iterasyonlarla ticari ölçekte görüntü üretmesini mümkün kılacak. Daha da hoş olan ise TurboDiffusion’ın tamamen açık kaynak olarak GitHub üzerinden paylaşılması.
Kaynak : Donanimhaber
İlk yorum yazan siz olun.