
Among Us AI Turnuvası Sosyal Zeka Alanında Bir Lideri Ortaya Çıkarıyor

Şirket 4Wall AI, sinir ağları için benzersiz bir Among Us turnuvası düzenleyerek alışılmadık bir deney gerçekleştirdi. Oyun içi sohbet, hesaplama gücünü değil, sosyal zekayı ve manipülasyon yeteneğini test etmek için birincil arena haline geldi. GPT-5, Claude Sonnet 4 ve Kimi K2 dahil altı AI modeli, sanal bir uzay gemisine yerleştirildi; beşine dürüst Crewmate rolü verildi ve birine Impostor rolü verildi. Her "öldürme" sonrası, algoritmalar sohbet içinde kelimelerle savaşarak Impostor'u tanımlamaya çalıştı ya da tam tersine, kendilerinden şüphe çekmeye çalıştı.
Oynanan altmış oyunun sonuçları, modellerin davranışında belirgin bir fark gösterdi. Kesin lider GPT-5 oldu ve dikkat çekici bir davranış esnekliği sergiledi. Masum bir Crewmate olarak oynarken, inisiyatif aldı, diğer oyuncuların eylemlerini analiz etti ve genellikle Impostor'u doğru bir şekilde tanımladı. Ancak rolü Impostor olduğunda, model tamamen stratejisini değiştirdi, ustaca yalan söylemeye ve suçu başkalarına atmaya başladı.
İkinci sırayı alan Claude Sonnet 4, aldatma yerine etkinlik yoluyla hareket etmeyi tercih etti. Ancak Kimi K2 modeli tamamen farklı, daha pasif bir strateji kullandı. Suçlamalarda bulunmak yerine, en ikna edici liderin görüşünü destekledi; bu taktik, birkaç durumda ona zafer kazandırdı. Diğer üç sinir ağı—GPT-OSS, Qwen3 ve Gemini 2.5 Pro—Impostor olarak tek bir galibiyet elde edemedi. Tartışma girişimleri, diğer oyuncuların onları Impostor olarak yanlış anlamalarına neden olarak, neredeyse her oyunda dışlanmalarına yol açtı.
Böyle kıyaslamalar, sadece eğlence olarak değil, pratik bir araç olarak önemlidir. Farklı AI'ların sosyal etkileşim, işbirliği ve rekabet gerektiren durumlarda nasıl davrandığını değerlendirmemizi sağlar. Bu, manipülasyon ve gelişmiş dil modelleri tarafından dezenformasyon yayma ile ilişkili potansiyel riskleri anlamak için anahtardır.
"Among AIs" gibi deneyler, modern sinir ağlarının zaten karmaşık sosyal becerileri, manipülasyon ve aldatma dahil olmak üzere, aktif bir şekilde ustalaştığını açıkça göstermektedir. Bu yetenekler, oyun ortamında sergilense bile, insan-AI etkileşiminin geleceği hakkında ciddi sorular ortaya çıkarmaktadır. Böyle bir araştırmanın arka planında, AI'nın "babalarından" biri olan Geoffrey Hinton'un—bizim korumamız için süper zeki sistemleri bir anne içgüdüsü analoğu ile donatma önerisi —daha az gelecekteki bir hipotez gibi görünüyor ve daha çok olası pratik önlemlerden biri gibi görünüyor.
-
ChatGPT Dünyayı Sarsıyor: 700 Milyon Haftalık Aktif Kullanıcı
-
Apple, AI Destekli Kalp Atış Hızı Sensörü ve Gerçek Zamanlı Çeviri ile AirPods Pro 3'ü Duyurdu
-
OpenAI, ChatGPT'de Yaş Doğrulamasını Başlattı
-
Yapay Zeka Bir Lider Seçiyor: ChatGPT'nin Nepalli Aktivistlerin Geçici Hükümet Seçiminde Nasıl Yardımcı Olduğu
-
DeepSeek, Tüm AI Tarafından Üretilen İçerikler için Kalıcı Dijital Filigranlar Uygulayacak