| 微軟今日宣佈正式向網頁、Windows 及移動端用戶推送 OpenAI 迄今爲止最強大的模型系列——GPT-5.2。作爲一次極具誠意的免費升級,GPT-5.2將以“智能增強版”模式與現有的 GPT-5.1模型共存,標誌着 Copilot 正式進入深度邏輯推理時代。這一被譽爲“專家級”的模型不僅能以更快的速度完成構建電子表格、編寫審查代碼、理解超長文檔等實際任務,更在處理複雜工具調用和圖像分析方面表現出了前所未有的成熟度。

QQ20251230-092111.png

從性能維度看,GPT-5.2帶來的飛躍不僅體現在速度上,更在於其深度思考的能力。微軟明確表示,Copilot 上的 GPT-5.2Plus 版本實質上是 GPT-5.2的“思考型”變體。在涵蓋44個職業的知識工作任務基準測試中,GPT-5.2Thinking 在高達70.9% 的情況下表現優於或持平行業專業人士,而此前 GPT-5的這一比例僅爲38.8%。這種近乎翻倍的進步,使得 OpenAI 能夠底氣十足地將該模型定位爲處理演示文稿、日程安排及各類專業交付物的頂級專家,爲辦公自動化設定了新的行業天花板

在硬核的技術基準測試中,GPT-5.2同樣展示了其統治地位。在編程領域,它在 SWE-Bench Pro 和 SWE-bench Verified 上的得分均刷新了紀錄,顯著超越了 GPT-5.1Thinking。而在最具挑戰性的邏輯與科學測試中,該模型在 GPQA Diamond 測試中獲得了92.4% 的高分,更是在 AIME2025數學測試中達成了100% 的滿分成就。

此外,其在 CharXiv 推理和 ARC-AGI-2測試中的大幅提升,印證了微軟正通過技術迭代,讓 Copilot 從一個基礎的助手進化爲具備嚴密邏輯體系的數字智慧體,從而在激烈的 AI 競賽中持續保持領先優勢。