Çinli teknoloji devi Alibaba, görsel içeriklerle çalışmayı kolaylaştırmak için tasarlanmış iki yeni AI modelini tanıttı: Qwen-Image-Edit fotoğraf editörü ve Wan 2.5 video üretim modeli. Her iki araç da ücretsiz olarak kullanılabilir durumda olup, güçlü AI özelliklerini geniş bir kitleye sunuyor. Bu yeni ürünler, fotoğraf editörü Nano Banana ile, video modeli ise Veo 3 ile karşılaştırılarak Google'ın en son gelişmelerine doğrudan rakip olarak konumlandırılıyor.
Fotoğraf editörünün önemli bir özelliği, birden fazla görüntü ile aynı anda çalışabilme yeteneğidir. Örneğin, bir kullanıcı bir kişiyi bir fotoğraftan alıp başka bir fotoğrafın arka planına "aktarma" yapabilirken, görünümünü ve hedef görüntünün tüm detaylarını titizlikle koruyabilir. Sistem, nesneleri, sahneleri ve hatta portre stillerini ustaca harmanlıyor. Ayrıca, Qwen-Image-Edit'te metin istemleri kullanarak, kullanıcılar bir çerçevedeki nesneleri yeniden düzenleyebilir, yeni unsurlar ekleyebilir veya sadece bir ürün fotoğrafı kullanarak tanıtım afişleri oluşturabilir. Araç, bir görüntü içindeki metni düzenleyebilir, fontu, rengi ve boyutunu değiştirebilir. Tüm bu özellikleri, "Image Edit" seçeneğini seçerek Qwen sohbet botunda ücretsiz olarak deneyebilirsiniz.
Wan 2.5 modeli, sinematik bir görünüm üzerinde özel bir vurgu ile Full HD kalitesinde 10 saniyeye kadar kısa videolar üretmektedir. AI, ışık, gölge ve pozlama konusunda gelişmiş bir işleme ile görüntüler üretir. Kullanıcılar, belirli bir atmosfer oluşturmak için yalnızca metin istemlerinden değil, aynı zamanda görüntülerden ve ses parçalarından da videolar oluşturabilir.
Model ayrıca bir video düzenleme işlevi de içeriyor. Her ne kadar kare hassasiyetine sahip olmasa da, birçok öğenin detaylı bir şekilde değiştirilmesine olanak tanıyor. Wan 2.5'in ücretsiz versiyonunun bazı sınırlamaları var: kullanıcılar yalnızca bir kaynak dosyası yükleyebilir ve çıktı bir filigran içerecektir. Ancak, yaklaşık 4-5 $ aylık bir fiyatla Pro aboneliği bu kısıtlamaları kaldırır ve öncelikli erişim sağlar, işleme kuyruklarını atlayarak.
Bu araçların duyurusu, hem sıradan kullanıcıların hem de profesyonellerin dikkatini çekmek için büyük teknoloji şirketlerinin kıyasıya rekabet ettiği üretken AI alanındaki rekabeti artırıyor.
Alibaba gibi bazı şirketler, erişilebilir multimedya araçları yaratmaya odaklanırken, diğerleri daha niş, ancak teknolojik olarak karmaşık yönleri keşfediyor. Örneğin, Tencent yakın zamanda HunyuanWorld-Voyager modelini tanıttı, bu model tek bir statik görüntüyü kamera hareketi efekti ile bir videoya dönüştürebiliyor. Ancak, kitlesel pazar çözümlerinin aksine, bu tür gelişmeler, aşırı donanım gereksinimleri ve lisans kısıtlamaları nedeniyle büyük ölçüde profesyonellerin alanında kalmaktadır.