Qwen3-VL登頂SpatialBench：空間推理13. 5 分刷新SOTA，3D檢測能力再升級

阿里千問視覺模型在第三方空間推理榜單SpatialBench奪得前兩名:Qwen3-VL13.5分、Qwen2.5-VL12.9分，大幅領先Gemini3.0Pro Preview（9.6分）與GPT-5.1(7.5分)，距離人類基線80分再近一步。

榜單特點

SpatialBench專注2D/3D空間、結構、路徑推理，含電路分析、CAD工程、分子生物學等複雜任務，被視爲“具身智能試金石”。

模型亮點

-3D檢測升級:Qwen3-VL新增旋轉框輸出與深度估計頭，遮擋場景AP↑18%，可判斷物體方位、視角變化

- 視覺編程:輸入草圖或10秒短視頻即可生成可運行Python+OpenCV代碼，實現“所見即所得”

- 規模多樣:提供2B/4B/8B/32B密集模型及30B-A3B、235B-A22B MoE版本，推理版在32項核心能力測試中平均超越Gemini2.5-Pro6.4分

開源節奏

Qwen2.5-VL已全量開源;Qwen3-VL預計2025年Q2釋放權重與工具鏈，同步上線千問App免費體驗。

落地進展

阿里雲透露，Qwen3-VL已在物流機器人、AR裝配、智慧港口等場景POC，空間定位誤差<2cm，2026年將推出“視覺-動作”端到端模型，爲機器人提供實時視覺伺服能力。

阿里千問全面開放第三方Agent與Skill，瑞幸、東航等首批接入測試

阿里千問於6月3日宣佈全面開放第三方Agent和Skill，支持企業在千問生態中打造專屬品牌Agent，加速從大語言模型向“超級Agent”個人助手的戰略升級。企業可在千問APP中自定義人設與服務能力，用戶通過自然語言交互直接表達需求，無需切換應用，由Agent理解意圖並完成服務。

高德聯合千問開源AGenUI：一套代碼，讓Agent UI同時跑在iOS、安卓和鴻蒙上

高德與阿里千問C端團隊聯合發佈AGenUI，這是行業首個覆蓋iOS、Android、HarmonyOS三端的端雲一體原生A2UI開源框架。開發者接入SDK後，可將Agent輸出直接渲染爲可交互的原生卡片，無需爲不同平臺單獨編寫UI代碼。AGenUI基於Google A2UI最新開放協議構建，後者定義了模型描述界面的標準方式，而AGenUI則補齊了將這些描述轉化爲實際界面的能力。

阿里千問AI眼鏡全球首店今日開業！選在機場開，這步棋走得很妙

4月15日，阿里千問AI眼鏡全球首家線下體驗店在南京祿口機場T2航站樓開業。該店由東部機場集團與阿里巴巴合作打造，是千問AI硬件生態的首個線下綜合體驗中心。不同於普通展示櫃臺，它提供“尖端科技體驗+專業驗光配鏡”一站式服務，並與南京明亮眼鏡合作，打通從體驗、驗光到配鏡的全流程。

Qwen3-VL登頂SpatialBench：空間推理13. 5 分刷新SOTA，3D檢測能力再升級

相關推薦

阿里千問全面開放第三方Agent與Skill，瑞幸、東航等首批接入測試

阿里千問發佈新一代大模型Qwen3.7-Max

高德聯合千問開源AGenUI：一套代碼，讓Agent UI同時跑在iOS、安卓和鴻蒙上

阿里巴巴發佈生態級AI助手“千問小酒窩”，統一數字人形象全面接入阿里生態

阿里千問AI眼鏡全球首店今日開業！選在機場開，這步棋走得很妙