字節跳動Seed團隊近日公佈了2025高考全科測試的驚人結果:豆包Seed1.6-Thinking模型在高考中取得文科683分、理科648分的優異成績,達到清華北大錄取分數線,在國內外AI模型高考測試中表現搶眼。
此次測試採用全國新一卷和山東省自主命題試卷,豆包與谷歌Gemini2.5Pro、DeepSeek R1、OpenAI o3等5款國內外頂級AI模型同臺競技。豆包文科成績683分在參測模型中獲得最高分,理科成績648分僅次於谷歌Gemini2.5Pro的655分。在單科表現上,豆包在語文、英語、物理、歷史、地理、政治六門學科均獲最高分,數學成績也超過140分,展現出色的邏輯推理能力。
在這場AI"高考大戰"中,各模型展現了不同的學科優勢。DeepSeek R1獲得數學單科最高分145分,Gemini2.5Pro以82分獲得化學最高分,OpenAI o3則與Gemini2.5Pro並列生物最高分77分。這種差異化表現反映了不同AI模型在知識結構和推理方式上的特色。
Seed團隊發現了一個重要技術細節:首次測試中由於網絡版考卷清晰度較低,各大模型在化學、生物等依賴圖像的科目中普遍丟分嚴重。在獲得高清版試題圖片後,團隊採用圖文交織方式重新測試,結果顯示豆包在化學、生物兩科提升近30分,理科總成績可達676分。這一發現驗證了全模態推理對激發模型潛力的重要作用,爲AI在視覺理解和跨模態推理方面的發展提供了重要啓示。
山東省採用"3+3"高考模式,語數英爲基礎學科,另選三門科目採用等級賦分制。據當地資深高中教師分析,豆包賦分成績組合最高可達690分左右,參照2025年山東地區一分一段表,排名約在前80位,成績足以衝擊清華、北大等頂尖學府。這一表現不僅展示了豆包的絕對實力,更體現了其在複雜評分體系下的適應能力。
豆包在高考中的出色表現不僅展示了其強大的知識儲備和推理能力,更重要的是驗證了多模態AI在複雜認知任務中的巨大潛力。特別是在圖文結合的理科題目處理上,豆包展現出的近30分提升幅度,爲AI教育應用提供了新的技術路徑。這一成績的取得,標誌着國產AI大模型在綜合認知能力上已達到國際先進水平,爲AI在教育領域的深度應用奠定了堅實基礎。