OpenAI Sessizliğini Bozdu: 6 Yılda İlk Açık Kaynaklı AI Modelleri GPT-OSS'yi Tanıttı

OpenAI Sessizliğini Bozdu: 6 Yılda İlk Açık Kaynaklı AI Modelleri GPT-OSS'yi Tanıttı

Arkadiy Andrienko

OpenAI, iki yeni açık kaynaklı yapay zeka modeli tanıttı: GPT-OSS-120B ve GPT-OSS-20B. Bu modeller, OpenAI'nin 2019'daki GPT-2'den bu yana çıkardığı ilk açık dil modeli sürümleridir. Güçlü mantıksal akıl yürütme, verimli araç kullanımı ve düşük dağıtım maliyetleri için tasarlanan bu modeller, Apache 2.0 lisansı altında kullanım, değişiklik ve ticari projelere entegrasyon için serbestçe mevcuttur.

Model Özellikleri:

  • GPT-OSS-120B: 120 milyar parametre (token başına 5.1B aktif). 80GB VRAM GPU gerektirir. Performans testleri, o4-mini'ye yaklaşan bir performans göstermektedir.
  • GPT-OSS-20B: 20 milyar parametre (3.6B aktif). 16GB bellekli cihazlarda çalışır. Akıl yürütme kalitesi ve doğruluğu o3-mini ile karşılaştırılabilir.

Her iki model de gelişmiş araç kullanımını (web araması ve Python kodu çalıştırma gibi) destekler, yapılandırılmış çıktılar sunar ve hata ayıklama için akıl yürütme süreçlerini şeffaf hale getiren bir Düşünce Zinciri (CoT) yaklaşımını kullanır. Kritik olarak, tamamen kendi altyapınızda çalışacak şekilde tasarlanmışlardır, bu da OpenAI'nin API'sine olan ihtiyacı ortadan kaldırır.

Modeller, Hugging Face'den şimdi indirilmek üzere mevcuttur ve GitHub'da yerel dağıtım kılavuzları bulunmaktadır. GPT-OSS'nin piyasaya sürülmesi, daha şeffaf ve erişilebilir bir yapay zeka ekosistemine doğru atılmış büyük bir adımdır. Bu modeller, geliştiricilere yerel dizüstü bilgisayarlardan kurumsal ortamlara kadar her yerde özel çözümler oluşturma ve eğitme özgürlüğü verir; büyük bulut platformlarına ve kapalı, özel sistemlere olan bağımlılığı önemli ölçüde azaltır.

    Yazar hakkında
    Yorumlar0