主要な大規模言語モデル(LLM)の認知機能についてモントリオール認知評価(MoCA)テストなどを用いて評価した結果、ChatGPT-4oを除いたLLMで軽度認知機能障害の兆候が認められたことを、イスラエル・Hadassah Medical CenterのRoy Dayan氏らが報告した。人間と同様に年齢が認知機能低下の重要な決定要因であり、「高齢」すなわちバージョンが古いチャットボットはMoCAテストの成績が不良である傾向がみられたという。著者は、「これらの結果は、近くAIが人間の医師に取って代わるという想定に疑問を投げ掛けるものであり、主要なチャットボットの認知機能障害は医療診断の信頼性に影響を与え、患者の信頼を損なう可能性がある」と述べている。これまで複数の研究により、LLMはさまざまな診断において人間の医師よりも優れていることが示されているが、AI自体が認知機能低下を来すかどうかは評価されていなかった。BMJ誌2024年12月20日号掲載の報告。