最新研究顯示,GPT-4在圖形推理任務上僅有33%準確率,引發了對其圖形處理能力的關注。研究者使用ConceptARC數據集測試,結果顯示人類在同一任務上的平均準確率爲91%,遠高於GPT-4。研究方法引發質疑,包括受試者招募和輸入方式,突顯大型語言模型在某些任務上的侷限性,呼籲深入審視研究方法。