近日,阿里巴巴推出的開源大模型 “通義千問3”(Qwen3)在上線僅七天後,便成功奪得了全球開源模型的冠軍地位。這一成果是在國際權威大模型評測榜 LiveBench 最新發佈的排名中取得的,標誌着阿里在人工智能領域又一次取得了重要突破。

據悉,通義千問3在指令遵循能力方面,表現超越了諸多頂級閉源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功躋身全球第一的位置。這一榜單由著名圖靈獎得主、Meta 首席 AI 科學家楊立昆聯合紐約大學等多個機構共同發佈,全面評估大模型的數學、推理、編程及語言理解等多個維度。由於其採用動態更新的題庫,通義千問3被譽爲 “全球首個無法作弊的模型基準測試”。

通義 Qwen (4)

圖源備註:圖片由AI生成

通義千問3的正式發佈是在4月29日。該模型的參數量僅爲 DeepSeek-R1的三分之一,成本大幅降低,同時性能卻超越了包括 OpenAI 在內的多款全球頂尖模型。千問3是國內首個 “混合推理模型”,它結合了 “快思考” 和 “慢思考” 兩種模式,能夠在處理簡單問題時快速響應,而在面對複雜問題時進行多步驟深入思考,這樣不僅提高了算力的使用效率,也顯著節省了資源。

另外,通義千問3的部署成本也非常友好,用戶只需四張 H20就能實現千問3的滿血版部署,顯存佔用僅爲性能相近模型的三分之一。這一顯著的性能提升,充分證明了阿里巴巴在大模型領域的創新能力與技術實力。

通義千問3的發佈,將推動更多企業與開發者參與到開源 AI 模型的構建中,爲行業的發展注入新的活力。隨着大模型技術的不斷進步,我們期待未來將有更多實用而創新的應用出現。