DeepSeek, DALL-E 3 ve Stable Diffusion'ı görüntü üretim yeteneklerinde geride bırakarak Janus-Pro-7B'yi piyasaya sürdü.

DeepSeek, DALL-E 3 ve Stable Diffusion'ı görüntü üretim yeteneklerinde geride bırakarak Janus-Pro-7B'yi piyasaya sürdü.

Arkadiy Andrienko

Çinli şirket DeepSeek, verimli görüntü tanıma ve üretimi için tasarlanmış yeni çok modlu sinir ağı Janus-Pro-7B'yi tanıttı. Önceki versiyonlara kıyasla, yeni model önemli ölçüde geliştirilmiştir: eğitim algoritmaları optimize edilmiş, veri seti genişletilmiş ve model boyutu artırılmıştır. Bu değişiklikler, sinir ağının metin açıklamalarından görüntü üretimi ve görüntü analizi ile ilgili görevlerde performansını büyük ölçüde artırmasını sağlamıştır.

Janus-Pro-7B, GenEval ve DPG-Bench testlerinde DALL-E 3 ve Stable Diffusion gibi tanınmış modelleri geride bırakmıştır. Bu sinir ağı, görüntü oluşturma konusunda yüksek detay ve gerçekçilik seviyeleri sunarak diğer çözümlerle güçlü bir rekabet oluşturuyor. Model, Hugging Face platformunda zaten mevcut ve kodu ücretsiz olarak GitHub'dan indirilebilir, bu da araştırmacıların ve geliştiricilerin gelişimine katkıda bulunmasını sağlıyor.

    Yazar hakkında
    Yorumlar0