OpenAI, GPT-4o modelinin yeni görsel oluşturma özelliklerini duyurdu. Şirketin açıklamasına göre GPT-4o önceki modellere göre çok daha hassas, ayrıntılı ve gerçekçi görseller üretme yeteneğine sahip. Bu özellik sayesinde kullanıcılar sadece basit komutlarla istedikleri görselleri oluşturabilecek, düzenleyebilecek veya mevcut görseller üzerinden yeni tasarımlar geliştirebilecek.
GPT-4o ile görsel oluşturmada yeni dönem!
OpenAI görsel oluşturma yeteneğinin dil modelleri için temel bir beceri olması gerektiğini uzun süredir savunuyor. GPT-4o da bu düşünce doğrultusunda geliştirilen şirketin şu ana kadarki en gelişmiş ve kullanışlı görsel oluşturma sistemi. GPT-4o ile yaratılan görseller yalnızca estetik açıdan değil, bilgi aktarımı açısından da oldukça kullanışlı hale geldi.

Yeni model kullanıcıların verdiği komutları daha doğru şekilde anlayıp görsellere daha hassas biçimde uyguluyor. Özellikle karmaşık ve çok nesneli görsellerde GPT-4o rakiplerine göre daha iyi performans gösteriyor.
Örneğin, model artık 10 ila 20 farklı objeyi tek bir görsel içerisinde tutarlı şekilde bir araya getirebiliyor. Ayrıca modelin görsellerdeki metinleri ve sembolleri doğru şekilde işleyebilme özelliği sayesinde logolar, diyagramlar, infografikler gibi bilgilendirici görselleri üretmek çok daha kolay hale geliyor.

OpenAI’nin paylaştığı örnekler arasında, beyaz tahtada yapılan toplantı notları, çizgi romanlar, bilimsel deneylerin ayrıntılı infografikleri ve anlamlı metinlerle desteklenen görseller bulunuyor. Şirketin açıklamasında, görsel oluşturmanın sadece dekoratif amaçlı değil, bilgi paylaşımı ve iletişimde de güçlü bir araç olarak kullanılması gerektiği vurgulandı.

Yeni GPT-4o modeli, çok adımlı görsel üretimi özelliğine de sahip. Bu sayede kullanıcılar, oluşturdukları görselleri doğal bir sohbet üzerinden modelle birlikte geliştirebiliyor. Örneğin, bir oyun karakterinin tasarımı adım adım şekillendirilebilir ve her adımda karakterin tutarlılığı korunabilir.
GPT-4o, kullanıcının yüklediği görselleri analiz ederek bu görsellerden yeni görseller türetebilme yeteneğine de sahip. Bu özellik, modeli kullanıcılar için daha sezgisel ve kişiselleştirilmiş bir araç haline getiriyor. OpenAI’ye göre, GPT-4o modelinde kullanılan görüntülerin çeşitliliği ve stili, modelin foto-gerçekçi görseller oluşturabilmesine ve görsel dönüşümleri ikna edici biçimde gerçekleştirebilmesine imkân sağlıyor.

OpenAI, yeni modelin henüz bazı sınırlamalara sahip olduğunu kabul ediyor. Özellikle küçük boyutlu yazılar içeren çok yoğun bilgi barındıran grafikler veya çoklu diller içeren görsellerde bazı sınırlamalar bulunuyor. Ayrıca bazen istenmeyen görsel kırpmaları ve tutarsızlıklar gibi problemlerin yaşanabileceği ifade edildi. Şirket, gelecekte bu konularda iyileştirmeler yapılacağını belirtti.
OpenAI, görsel oluşturma özelliğini güvenli hale getirmek için çeşitli önlemler aldığını da duyurdu. GPT-4o tarafından üretilen tüm görsellere, içeriğin kaynağının OpenAI olduğunu belirten C2PA meta verileri ekleniyor. Bu sayede oluşturulan içeriklerin orijinalliği daha kolay bir şekilde doğrulanabiliyor. Ayrıca zararlı içerik taleplerinin otomatik olarak engellendiği vurgulandı.
Bugünden itibaren GPT-4o’nun görsel oluşturma özellikleri ChatGPT’de Plus, Pro, Team ve ücretsiz kullanıcılar için varsayılan seçenek olarak sunulmaya başlandı. Enterprise ve Edu kullanıcıları da kısa süre içinde bu özellikten yararlanabilecek.
DALL·E severler için ise bu model hala özel bir DALL·E GPT üzerinden kullanılabilecek. Ayrıca geliştiriciler önümüzdeki haftalarda API aracılığıyla GPT-4o’nun görsel oluşturma özelliğini kullanabilecek.