Haberler Donanım ve Teknolojiler OpenAI, ChatGPT'ye GPT-4o tarafından desteklenen Akıllı Görüntü Üretimini Entegre Ediyor

OpenAI, ChatGPT'ye GPT-4o tarafından desteklenen Akıllı Görüntü Üretimini Entegre Ediyor

Arkadiy Andrienko
Tam sürümde oku

OpenAI artık güçlü bir görüntü oluşturma aracını doğrudan ChatGPT'ye entegre etti. Bugünden itibaren, kullanıcılar güncellenmiş GPT-4o modelini kullanarak ayrıntılı görseller oluşturabilirler; bu model bağlamı anlama, karmaşık talepleri işleme ve hatta görüntüler içinde mükemmel metin oluşturma konusunda oldukça başarılıdır.

Önceki ChatGPT sürümleri DALL-E 3 sinir ağına dayanıyordu, ancak yeni sistem — ChatGPT'deki Görseller olarak adlandırılan — çok modlu “evrensel” GPT-4o üzerinde çalışıyor. Bu, modelin metin, ses, video ve görüntüleri aynı anda işleyerek doğruluğu önemli ölçüde artırdığı anlamına geliyor. Artık yapay zeka, tek bir görüntüde 15-20 nesneyi doğru bir şekilde ilişkilendirebiliyor ve daha önce 5-8 öğe ile meydana gelen hatalardan kaçınıyor.

Önemli iyileştirmelerden biri, mükemmel okunabilir metin içeren görüntüler üretme yeteneğidir — bu, uzun zamandır üretken modellerin zayıf noktası olmuştur. ChatGPT artık restoran menüleri, başlıklarla logolar veya yazım hatası olmadan infografikler oluşturabiliyor. Ayrıca, kullanıcıların artık bir düzenleme özelliği var: yüklenen herhangi bir görüntü, metin istemi aracılığıyla öğeleri ekleyerek veya çıkararak değiştirilebilir.

Bu yeni özellik, ücretsiz katman da dahil olmak üzere tüm ChatGPT aboneliklerine açıktır, ancak DALL-E 3 ile benzer sınırlamalar hala geçerlidir. Bu arada, DALL-E özel GPT modülleri aracılığıyla kullanılmaya devam edecektir. OpenAI ayrıca güvenliğe özel önem vermiştir: tüm görüntüler, AI tarafından üretilen içeriği tanımlamak için C2PA meta verileri ile işaretlenmiştir ve sistem, şiddet, derin sahte içerikler ve diğer potansiyel kötüye kullanımlarla ilgili talepleri engellemektedir.

    Yazar hakkında
    Yorumlar0
    Yorum bırak