Makaleler Donanım ve Teknolojiler Elon Musk'un «Korkunç Derecede Akıllı» Chatbot'u Ne Kadar Akıllı?

Elon Musk'un «Korkunç Derecede Akıllı» Chatbot'u Ne Kadar Akıllı?

18 Şubat 2025, 18:45

xAI, şirketin kurucusu Elon Musk'ın "Dünyadaki en zeki yapay zeka" olarak adlandırdığı yeni bir dil modeli olan Grok 3'ü tanıttı. Sohbet botunun yaratıcıları, yeni versiyonun önceki sürümü önemli ölçüde aştığını iddia ediyor: daha büyük bir eğitim verisi hacmini işliyor ve yeni kendini düzeltme mekanizmaları içeriyor. Grok 3 demo versiyonu bugün piyasaya sürüldüve ilk incelemeler şimdiden ortaya çıktı.

Yeni Neler Var

Grok 3'ün en büyük avantajı, geliştirilmiş hesaplama kaynaklarına erişimdir. Sohbet botu, Colossus süper bilgisayarı kullanılarak eğitildi: başlangıç aşamalarında, yaratıcıları 100.000 NVIDIA H100 GPU kullandı, daha sonra bu sayıyı iki katına çıkardı. Gelecekte, hesaplama gücünün beş kat artması bekleniyor.

Grok 3, yerleşik kendini düzeltme mekanizmaları içeriyor. Yapay zeka, kendi yanıtlarını analiz ediyor, bunları referans yanıtlarla karşılaştırıyor ve ardından ayarlamalar yapıyor. İlginç bir şekilde, sohbet botu doğru yanıtlar için "ödüller" ve sözde "halüsinasyonlar" — yanlış veya uydurulmuş bilgiler için "cezalar" alıyor.

xAI temsilcilerine göre, Grok 3 matematik, doğal bilimler ve programlama alanlarında diğer modellerden daha zeki. Yanıt kalitesini değerlendirmek için kör testler kullanıldı, yani kullanıcılar hangi sohbet botunun yanıt verdiğini bilmiyordu.

Grok 3 sunumu sırasında, xAI ayrıca hızlı bir şekilde çevrimiçi bilgi bulma ve analiz etme yeteneğine sahip "bir sonraki nesil" arama ajanı olan Deep Search'ü de tanıttı. Benzer özellikler rakip modellerde mevcut olsa da, xAI, Deep Search'ün daha doğru olduğunu iddia ediyor.

Ayrıca, Grok 3 yakında bir ses arayüzü alacak ve kullanıcıların onunla gerçek bir kişiyle konuşuyormuş gibi etkileşimde bulunmalarına olanak tanıyacak. Sesinin, rakip modellerden daha doğal ve ifade dolu olduğu söyleniyor.

{poll4570}

Uygulamada Nasıl Performans Gösteriyor

X sosyal ağındaki kullanıcılar, ayda 50 $ karşılığında X Premium+ abone olarak yeni sohbet botuna erişebilirler. Grok 3 için henüz çok fazla erken inceleme yok, ancak bazıları öne çıkıyor.

Örneğin, Penny2x adlı bir kullanıcı paylaştı ki yeni yapay zeka versiyonunu kullanarak tamamen işlevsel bir oyun yarattı:

Grok 3 yeni piyasaya sürüldü. Buna inanmayacaksınız, ben zaten bir oyun yarattım.

(Bu sabah ERKEN erişim aldım).

Bu oyun %100 GROK tarafından yaratıldı, sadece ne istediğimi söyledim ve kodu doğru yere koydum.

Sürekli ayarlamalar istiyorum ve o, masaüstüme koyup çalıştırabileceğim tek bir dosyada oyunu veriyor.

Oyun sonsuza dek değişti. İlk olarak, son zamanlarda diğer büyük AI geliştiricilerinden birçok AI ile çalıştım, en çok hangisini sevdiğime karar vermeye çalışıyorum ve grok bir OYUNCU. Resmi kıyaslamalarım yok ve henüz API ayarlamadım, bu yüzden normal iş akışım değil ama Sonet, 4o veya başka bir şey kadar yetenekli hissettirdi.

Önümüzdeki günlerde bunu NVIM'deki iş akışımın bir parçası olarak ayarlayacağım ve gerçek işte kullanacağım.

Bu inanılmaz. Gelecekte yaşıyoruz. Artık herkes bir geliştirici.

Daha da ilginç olan, OpenAI kurucu ortağı Andrej Karpathy'nin Grok 3 hakkında ne düşündüğü. O da yeni dil modelini test etti. Karpathy'ye göre, bazı alanlarda chatbot en iyi rakiplerle rekabet ediyor:

...Grok 3 açıkça son teknoloji düşünme modeline sahip ("Düşün" butonu) ve Settlers of Catan sorumda kutudan çıkar çıkmaz harika bir performans sergiledi:

"Settlers of Catan oyunundaki gibi bir altıgen ızgara gösteren bir masa oyunu web sayfası oluşturun. Her altıgen ızgara 1..N arasında numaralandırılmıştır, burada N toplam altıgen karoların sayısıdır. Genel bir tasarım yapın, böylece bir kaydırıcı kullanarak "halka" sayısını değiştirebiliriz. Örneğin, Catan'da yarıçap 3 altıgendir. Lütfen tek bir HTML sayfası oluşturun."

Bu doğru bir şekilde başaran birkaç model var. En iyi OpenAI düşünme modelleri (örneğin, o1-pro, ayda 200 $) bunu da yapıyor, ancak DeepSeek-R1, Gemini 2.0 Flash Thinking ve Claude bunu yapmıyor.

Andrej Karpathy ayrıca Grok 3'ün kararlılığını takdir etti:

Modelin, DeepSeek-R1'e benzer şekilde, Riemann hipotezini çözmeye çalışmasını seviyorum, ancak anında pes eden birçok diğer modelin aksine (o1-pro, Claude, Gemini 2.0 Flash Thinking) ve bunun büyük bir çözülmemiş problem olduğunu söylemekle yetiniyor. Sonunda onu durdurmak zorunda kaldım çünkü biraz kötü hissettim ama cesaret gösterdi ve kim bilir, belki bir gün...

Ancak bazı dezavantajlar vardı. Deep Search ajanı birkaç endişe dile getirdi:

…modelin varsayılan olarak X'i bir kaynak olarak referans vermeyi pek sevmediği görülüyor, ancak ona açıkça bunu istemeniz mümkün. Birkaç kez var olmayan URL'ler hayal ettiğini yakaladım. Birkaç kez yanlış olduğunu düşündüğüm gerçek şeyler söyledi ve bunun için bir alıntı sağlamadı (muhtemelen yok).

Sonuç olarak, Andrej Karpathy, ilk izlenimlere dayanarak, Grok 3'ün OpenAI'nin en iyi modellerine, örneğin o1-pro'ya (ayda 200 $) yaklaşmış olduğunu ve hatta DeepSeek-R1 ve Gemini 2.0 Flash Thinking'i biraz aştığını belirtti. xAI ekibinin bu AI'yi yaklaşık bir yıl önce sıfırdan geliştirmeye başladığını göz önünde bulundurursak, ilerleme etkileyici. Ancak, chatbotun gerçekten "en zeki" unvanını hak edip etmediğini belirlemek için daha kapsamlı testlere ihtiyaç var.

Önyargı Endişeleri

Elon Musk'ın ABD siyasi yaşamına aktif olarak katıldığı ve görüşlerini açıkça ifade ettiği bir sır değil. Bazı internet kullanıcıları Grok 3'ün belirli anlatıları da destekleyebileceğinden endişe ediyor.

Bu endişeler yersiz değil: Musk, chatbot'un bir haber medya kuruluşunu eleştirirken X'i en güvenilir bilgi kaynağı olarak övdüğünü gösteren bir ekran görüntüsü paylaştı. Bu, Grok 3'ün minimum sansürle bir ürün olarak konumlandırılmasına rağmen gerçekleşti. Birçok insan, yapay zekanın yargılarında tarafsız kalması gerektiğine inanıyor.

***

Yine de, başka bir umut verici dil modelinin piyasaya sürülmesi, devam eden yapay zeka yarışında önemli bir dönüm noktasını işaret ediyor. Rekabet ne kadar yüksekse, ilerleme o kadar hızlı oluyor.

Grok 3 hakkında ne düşünüyorsunuz? Düşüncelerinizi yorumlarda paylaşın.

{poll4569}

Gönderi çevrildi Orijinalini göster (EN)

PC Makaleler Donanım ve Teknolojiler

Yazar hakkında

Fazil Dzhyndzholiia

Editör ve katkıda bulunan

2013'ten beri oyunlar hakkında yazıyorum. Yüzlerce makalenin, incelemenin, önizlemenin ve senaryonun yazarıyım. Günümüzde çoğunlukla PC, PlayStation 5 ve Nintendo Switch 2'de oynuyorum. Favori türlerim hayatta kalma korkusu, souls-like ve RPG'ler. Favori oyunlar: Bloodborne ve Vampire: The Masquerade — Bloodlines. Favori seri: Resident Evil. Benim için oyun deneyimi çok önemli — iyi bir hikaye sıkıcı mekanikleri kurtaramaz. En azından, çoğu durumda.

...Genişlet

Yorumlar0