2025年高考剛落下帷幕,一場關於“AI能否解數學高考題”的實戰測試同步上演。在專業媒體的兩輪測評中,夸克分別以145分和146分位列第一,超越豆包,成爲國產AI數學能力的新標杆。
在公開測評中,參賽模型包括夸克、豆包、元寶以及ChatGPT,統一使用2025年全國一卷數學試題,全部關閉聯網搜索,僅開啓深度思考模式。
在知名媒體藍鯨財經的評測中,夸克以145分成功登頂。其中,在選擇題、填空題方面,夸克的正確率高達93%,位居第一。在8道單項選擇題中,所有AI產品都沒有答對第六題,通過思維鏈發現,答錯原因是爲AI在識別圖中的向量座標和箭頭方向時出現偏差。
而在“四木相對論”的評測中,夸克更是以146分,再次登頂。在答題速度上,夸克位列第一,豆包位列第二。以做解答題爲例,夸克能在4分鐘內完成一道題,其他產品的平均時間在6分鐘左右。
支撐夸克解題能力的是“夸克學習靈知大模型”。該模型以通義千問爲基礎,依託百億級學習資料庫和後訓練能力,尤其擅長解決理科類複雜問題,能爲用戶帶來啓發式學習的全新體驗。