Qwen3-VL登顶SpatialBench：空间推理13. 5 分刷新SOTA，3D检测能力再升级

阿里千问视觉模型在第三方空间推理榜单SpatialBench夺得前两名:Qwen3-VL13.5分、Qwen2.5-VL12.9分，大幅领先Gemini3.0Pro Preview（9.6分）与GPT-5.1(7.5分)，距离人类基线80分再近一步。

榜单特点

SpatialBench专注2D/3D空间、结构、路径推理，含电路分析、CAD工程、分子生物学等复杂任务，被视为“具身智能试金石”。

模型亮点

-3D检测升级:Qwen3-VL新增旋转框输出与深度估计头，遮挡场景AP↑18%，可判断物体方位、视角变化

- 视觉编程:输入草图或10秒短视频即可生成可运行Python+OpenCV代码，实现“所见即所得”

- 规模多样:提供2B/4B/8B/32B密集模型及30B-A3B、235B-A22B MoE版本，推理版在32项核心能力测试中平均超越Gemini2.5-Pro6.4分

开源节奏

Qwen2.5-VL已全量开源;Qwen3-VL预计2025年Q2释放权重与工具链，同步上线千问App免费体验。

落地进展

阿里云透露，Qwen3-VL已在物流机器人、AR装配、智慧港口等场景POC，空间定位误差<2cm，2026年将推出“视觉-动作”端到端模型，为机器人提供实时视觉伺服能力。

阿里千问全面开放第三方Agent与Skill，瑞幸、东航等首批接入测试

阿里千问于6月3日宣布全面开放第三方Agent和Skill，支持企业在千问生态中打造专属品牌Agent，加速从大语言模型向“超级Agent”个人助手的战略升级。企业可在千问APP中自定义人设与服务能力，用户通过自然语言交互直接表达需求，无需切换应用，由Agent理解意图并完成服务。

高德联合千问开源AGenUI：一套代码，让Agent UI同时跑在iOS、安卓和鸿蒙上

高德与阿里千问C端团队联合发布AGenUI，这是行业首个覆盖iOS、Android、HarmonyOS三端的端云一体原生A2UI开源框架。开发者接入SDK后，可将Agent输出直接渲染为可交互的原生卡片，无需为不同平台单独编写UI代码。AGenUI基于Google A2UI最新开放协议构建，后者定义了模型描述界面的标准方式，而AGenUI则补齐了将这些描述转化为实际界面的能力。

阿里千问AI眼镜全球首店今日开业！选在机场开，这步棋走得很妙

4月15日，阿里千问AI眼镜全球首家线下体验店在南京禄口机场T2航站楼开业。该店由东部机场集团与阿里巴巴合作打造，是千问AI硬件生态的首个线下综合体验中心。不同于普通展示柜台，它提供“尖端科技体验+专业验光配镜”一站式服务，并与南京明亮眼镜合作，打通从体验、验光到配镜的全流程。

Qwen3-VL登顶SpatialBench：空间推理13. 5 分刷新SOTA，3D检测能力再升级

相关推荐

阿里千问全面开放第三方Agent与Skill，瑞幸、东航等首批接入测试

阿里千问发布新一代大模型Qwen3.7-Max

高德联合千问开源AGenUI：一套代码，让Agent UI同时跑在iOS、安卓和鸿蒙上

阿里巴巴发布生态级AI助手“千问小酒窝”，统一数字人形象全面接入阿里生态

阿里千问AI眼镜全球首店今日开业！选在机场开，这步棋走得很妙