
OpenAI, yapay zeka dayanaklı görsel üretim alanında elini güçlendirmek için ChatGPT Images 2.0 sürümünü kullanıma sundu. Şirketin “dönüm noktası” olarak tanımladığı yeni sistem, sırf daha kaliteli görseller üretmekle kalmıyor tıpkı vakitte web’den bilgi çekebilen, akıl yürütebilen ve tek komutla birden fazla dengeli görsel oluşturabilen yeni jenerasyon yetenekler sunuyor.
Yeni “düşünme” yeteneği
ChatGPT Images 2.0’ın en dikkat alımlı yeniliği OpenAI’ın yeni GPT Image 2 modeli ile gelen “thinking” yani düşünme yetenekleri oldu. Bu özellik etkin edildiğinde sistem, sadece verilen komutla hudutlu kalmayıp internet üzerinden bilgi arayabiliyor, yüklenen belgeleri tahlil ederek görsel açıklamalar oluşturabiliyor ve görselin yapısını üretmeden evvel mantıksal olarak kurgulayabiliyor.
Bu gelişme, bilhassa doğruluk ve görsel bütünlüğün kritik olduğu senaryolarda değerli avantaj sağlıyor. OpenAI’a nazaran yeni model, sahnedeki objelerin pozisyonlandırılması, metin yerleşimi ve ayrıntıların korunması konusunda evvelki sürümlere kıyasla çok daha emniyetli sonuçlar veriyor.
Tutarlılık sorunu çözülüyor
Yeni sürümle birlikte kullanıcılar, tek bir komut üzerinden tıpkı karakterleri, objeleri ve görsel şekli koruyarak tıpkı anda sekiz farklı görsel üretebiliyor. Bu özellik bilhassa manga sayfaları, toplumsal medya içerik serileri ya da mimari tasarım planları üzere çoklu görsel gerektiren projelerde dikkat çekiyor. OpenAI, bu sayede kullanıcıların artık sahneler ortasında tutarlılık sağlamak için tekrar tekrar komut yazmasına gerek kalmayacağını vurguluyor. ChatGPT Images 2.0, teknik tarafta da değerli iyileştirmeler getiriyor. Sistem artık 2K çözünürlüğe kadar görseller üretebiliyor ve farklı kullanım senaryolarına uygun olarak 3:1 üzere geniş ya da 1:3 üzere dikey en-boy oranlarını destekliyor.
Yeni model yalnızca saf gerçekçiliğin yanı sıra piksel sanat, manga çizimleri, sinematik sahneler ve farklı görsel lisanlarda daha başarılı sonuçlar üretebiliyor. OpenAI, bu gelişmelerin bilhassa oyun prototipleme ve storyboard hazırlama üzere alanlarda kullanım pahasını artırdığını belirtiyor.
Yeni modelin öne çıkan bir başka tarafı ise metin üretiminde yaşanan gelişmeler oldu. OpenAI, Images 2.0’ın Japonca, Korece, Çince, Hintçe ve Bengalce üzere Latin alfabesi dışındaki lisanlarda “önemli iyileştirmeler” sunduğunu açıkladı.
Tüm kullanıcılara açıldı
OpenAI, ChatGPT Images 2.0’ı tüm ChatGPT kullanıcıları için erişime açtı. Lakin Plus, Pro, Business ve Enterprise aboneleri, gelişmiş düşünme yetenekleri ve daha güçlü çıktılara erişebiliyor. Sistem ayrıyeten OpenAI API ve Codex platformu üzerinden de kullanılabiliyor.
Kaynak : Donanimhaber
İlk yorum yazan siz olun.