Humaine tarafından yapılan kapsamlı araştırma, yapay zekâ pazarında beklenmedik sonuçlar ortaya koydu. Milyonlarca kişi tarafından kullanılan ChatGPT, kullanıcı değerlendirmelerine göre hazırlanan en iyi chatbot sıralamasında ancak sekizinci sırada yer aldı. Listenin zirvesinde ise Google Gemini 2.5 Pro bulunuyor; onu Çinli DeepSeek ve Fransız Magistral modelleri takip etti.
Humaine’in Sıralama Yöntemi: Gerçek Kullanıcı Diyalogları
Araştırmanın dikkat çeken yönü, tamamen gerçek diyaloglara dayanması. ABD ve Birleşik Krallık’tan yaklaşık 25 bin katılımcı, iki anonim modele aynı anda sorular yöneltti ve doğrudan “hangisi daha iyi?” şeklinde seçim yaptı. Bu head-to-head formatı sayesinde, modeller yalnızca görev başarısıyla değil, aynı zamanda:
- Mantık ve akıl yürütme yeteneği
- Diyalog akışını sürdürme
- Konu değişimine uyum sağlama
- Anlatım tarzı ve açıklık
- Güvenilirlik, etik standartlar ve güvenli yanıtlar
gibi çok boyutlu kriterler üzerinden değerlendirildi.
Araştırma, kullanıcıların artık yalnızca “doğru yanıt” beklemediğini; daha insansı, doğal ve güven veren bir sohbet deneyiminin öne çıktığını gösteriyor.
Kullanıcıların En İyi 10 Chatbot Seçimi
Araştırmaya göre ilk 10’a giren modeller şöyle sıralandı:
- Gemini 2.5 Pro
- DeepSeek v3
- Magistral Medium
- Grok 4
- Grok 3
- Gemini 2.5 Flash
- DeepSeek R1
- ChatGPT-4.1
- Gemma
- Gemini 2.0 Flash
Google ve DeepSeek’in daha düşük versiyonlarının da listeye girmesi, ancak üst modellerin gerisinde kalması, kullanıcıların esneklik, doğallık ve güncellenmiş zeka seviyesi gibi özelliklere daha fazla önem verdiğini ortaya koyuyor.
