Son yapılan bir araştırma, yapay zekanın bilişsel yeteneklerinin beklenenden düşük olduğunu gösterdi. Montreal Bilişsel Değerlendirme Testi (MoCA), insanlarda erken bunama tespiti için yaygın olarak kullanılan bir testtir. Ancak bu test, ilk kez yapay zeka modelleri üzerinde de denendi ve sonuçlar şaşırtıcıydı.
The BMJ dergisinde yayımlanan çalışmaya göre, ChatGPT 4, Claude 3.5 ve Gemini gibi popüler yapay zeka modelleri, Montreal Bilişsel Değerlendirme Testi'nde değerlendirildi. Testin amacı, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetenekleri ölçmekti. Sonuçlar ise yapay zekanın belirli alanlarda zayıf kaldığını ortaya koydu.
Yapay zekaların bu testte gösterdiği performans şaşırtıcıydı. ChatGPT 4, 30 üzerinden 26 puanla en yüksek skoru alırken, ChatGPT 4 ve Claude 3.5, 25 puanla bu puanı takip etti. Ancak Gemini 1.0, sadece 16 puanla en düşük skoru aldı. Bu, özellikle Gemini’nin bilişsel testlerde ciddi zorluklar yaşadığını gösterdi. Araştırma, eski yapay zeka modellerinin, yaşlanan insanlar gibi, bilişsel testlerde daha düşük performans gösterdiğini ortaya koydu. Bu bulgu, yapay zekanın gelecekte insan doktorlarının yerini almasıyla ilgili beklentilerin gözden geçirilmesi gerektiğini işaret ediyor.
Tüm yapay zeka modelleri, sayı ve harf sıralama gibi görevlerde ve saat çizme testlerinde düşük başarı gösterdi. Ayrıca, Gemini modelleri, hatırlama testlerinde de başarısız oldu. Ancak adlandırma, dikkat, dil ve soyutlama gibi bazı bilişsel görevlerde yapay zeka başarılı sonuçlar sergiledi.