Microsoft uzmanları, kompakt boyutuna rağmen daha büyük muadilleriyle karşılaştırılabilir sonuçlar sunan BitNet b1.58 2B4T dil modelini geliştirdi. Ana özelliği, grafik hızlandırıcılara ihtiyaç duymadan standart CPU'larda çalışabilme yeteneğidir. Bu, sınırlı kaynaklara sahip cihazlar için yapay zeka teknolojilerine erişimi açar.
Model, standart 16 veya 32 bit hesaplamalar yerine, -1, 0 ve +1 olmak üzere üç durumu olan basitleştirilmiş 1 bit işlemlerini kullanır. Bu yaklaşım, bellek kullanımını 400MB'a düşürür — karşılaştırma için, Google'ın en yakın rakibi (Gemma 3 1B) 1.4GB gerektirir. Tasarruf, veri işleme konusunda temelde farklı bir yaklaşım benimseyerek elde edilir: karmaşık matematiksel işlemler yerine, sistem optimize edilmiş ikili algoritmalara dayanır.
Testler sırasında, BitNet, Meta (LLaMa 3.2 1B), Google (Gemma 3 1B) ve Alibaba (Qwen 2.5 1.5B) modelleri ile karşılaştırıldı. Daha küçük boyutuna rağmen, Microsoft'un geliştirmesi kapsamlı testlerde ortalama 54.19 puan alarak LLaMa'yı (44.90) ve Gemma'yı (43.74) geride bıraktı ve yalnızca Qwen'in (55.23) biraz gerisinde kaldı; bu model 6.5 kat daha fazla bellek kullanıyor. Metin analizi ile ilgili belirli görevlerde, BitNet öne çıktı.
Maksimum verimlilik için model, açık GitHub deposunda mevcut olanözel bitnet.cpp çerçevesini gerektirir. Transformers kütüphanesi gibi standart araçlar, potansiyelini tam olarak açığa çıkarmaz. Geliştiriciler, mevcut sürümün CPU'lar için optimize edildiğini, ancak gelecekteki güncellemelerin nöroişlemciler ve GPU'lar için destek ekleyeceğini belirtmektedir.
BitNet, "hafif" yapay zeka modellerine yönelik eğilimin bir örneğidir. Bu tür çözümler enerji tüketimini azaltır ve karmaşık algoritmaların bulut hizmetine erişim olmadan cihazlarda çalışmasına olanak tanır. Bu, yavaş internetin olduğu bölgeler veya gizli verilerle çalışırken, bilgilerin veri merkezlerine iletilmesinin istenmediği durumlarda özellikle önemlidir. Geliştiricilere göre, hedefleri, donanım yükseltmeleri olmadan yapay zeka teknolojilerini erişilebilir hale getirmektir; bu, yapay zeka destekli uygulamaların geliştirilme yaklaşımını değiştirebilir.