
Photoshop Yerine Sohbet: Google'ın Gemini 2.0 Flash'ı Diyalogla Görüntü Düzenlemeyi Öğreniyor

Google, AI Stüdyosu'nda deneysel bir çok modlu Gemini 2.0 Flash sürümünü tanıtarak üretken AI yarışında beklenmedik bir adım attı. Model, yalnızca sıfırdan görüntü oluşturmakla kalmaz, aynı zamanda mevcut fotoğraflardaki detayları basit bir sohbet arayüzü aracılığıyla değiştirebilir — tüm resmi yeniden yaratmaya gerek kalmadan. Bu, büyük bir oyuncunun böyle bir işlevselliği tanıttığı ilk kezdir ve OpenAI ile Elon Musk'ın xAI'sini geride bırakmıştır.
Kullanıcılar, Gemini'ye "arka planı dağ manzarası ile değiştir" veya "Rusça bir altyazı ekle" gibi konuşma formatında komutlar verebilir. AI, konuşmanın bağlamını koruyarak bir dizi ilerleyici düzenlemeye olanak tanır. Örneğin, kullanıcılar bir kişinin kıyafetini değiştirebilir, ardından onu farklı bir yere "taşıyabilir" ve nihayetinde aydınlatmayı ayarlayabilir. Tüm değişiklikler doğrudan orijinal görüntüye uygulanır, zaman ve kaynak tasarrufu sağlar.
Her üretilen görüntü otomatik olarak SynthID filigranı ile işaretlenir — Google'ın derin sahtecilikle mücadele teknolojisi. Bu, artık içerikleri ticari projelerde yasal olarak kullanabilen tasarımcılar ve pazarlamacılar için özellikle önemlidir. Daha az belirgin ama aynı derecede etkileyici özellikler arasında doku klonlama, eski fotoğrafların renklendirilmesi ve hatta metin tabanlı öneriler kullanarak görüntülerdeki eksik unsurları "tamamlama" yer alır.
Gemini 2.0 Flash, Rusça komutları anlayabilse de, hizmet resmi olarak Rusya'da mevcut değildir. Geliştiriciler ve şirketler, modeli AI Stüdyosu veya API aracılığıyla ücretsiz olarak test edebilir, ancak yüz değiştirme veya karmaşık onarım gibi bazı özellikler kararsız kalmaktadır. Google, bunun erken bir sürüm olduğunu ve nihai sürümün gerçek zamanlı görevler için optimize edileceğini vurgulamaktadır.
Uzmanlar, Google'ın ilk kez Midjourney'in yaratıcı esnekliğini, DALL-E'nin hassasiyetini ve ChatGPT'nin etkileşimini tek bir modelde birleştirdiğini belirtmektedir. Deney başarılı olursa, tasarım, eğitim ve hatta gazetecilikte çalışmayı önemli ölçüde basitleştirebilir — anlık veri görselleştirmesi veya insan müdahalesi olmadan makale illüstrasyonları oluşturma imkanı sağlayabilir. Şu anda, Gemini 2.0 Flash, üretken AI'nın olanaklarını yeniden tanımlayan ilginç bir araç olmaya devam ediyor.