阿里云开源了视觉语言模型Qwen-VL,这是继8月开源通用模型Qwen-7B和对话模型Qwen-7B-Chat之后,又一个开源的大模型。Qwen-VL支持中英文,可以进行知识问答、图像标题生成、图像问答等多种应用。相比其他模型,Qwen-VL可以进行中文开放域定位,在图像中准确标注检测框。Qwen-VL基于Qwen-7B研发,引入视觉编码器,支持图像输入。Qwen-VL在多项视觉语言任务中的测试中,取得了同等模型最好的效果。Qwen-VL已在ModelScope等平台开源。多模态是大模型发展的重要方向,仍面临一定技术挑战。
相关推荐
阿里Qoder推出全托管平台Cloud Agents,实现AI Agent一天内快速上线
阿里云于2026年5月28日推出全托管AI Agent平台Cloud Agents,提供从底座到运行环境的全栈能力,企业通过API即可调用。该平台将Agent开发周期从1个月缩短至1天,加速AI原生应用渗透。当前通用Agent工具虽提升个人效率,但底层基础设施如推理引擎、运行沙箱等仍需完善。
2026年5月28号 15:01
208.8k
通义千问升级“拍照问健康”:能圈图、懂推理,三甲医生实测认可
阿里旗下通义千问APP于2026年5月27日升级“拍照问健康”功能,突破传统OCR限制,实现医学图像理解与临床推理。新功能包括视觉圈选,可自动标记化验单或患处异常区域;以及联动推理,结合年龄、性别和多指标关联进行排除法分析,提升诊断准确性。
2026年5月27号 14:21
224.7k
“阿里云·无锡青年创客AI加速计划”发布,开启漫剧青年创业全链路赋能
无锡举办AI漫短剧青年创客沙龙,共青团市委与阿里云达成战略合作,发布“阿里云·无锡青年创客AI加速计划”,通过五位一体支撑体系,为AIGC青年创业者提供全链路支持,旨在降低技术门槛、破解流量变现难题,助力青年创客实现商业化突破。
2026年5月26号 9:12
148.9k
阿里通义千问重磅升级:新旗舰Qwen3. 7 预览版全球首发亮相
阿里云通义千问大模型推出Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview预览版,已上线大模型竞技场及官方Qwen Chat。两款模型作为新一代旗舰预览版,仅支持“思考模式”,专注高难度逻辑推理与深度计算,预计在阿里云峰会正式发布。
2026年5月19号 9:55
537.0k
通义千问预告“重量级”大模型将于5月20日阿里云峰会亮相
阿里云通义千问大模型将于5月20日阿里云峰会上推出全新升级版本,在全能性、模型能力和深度广度上实现全面突破。此举标志着国内AI大模型在算力迭代与应用落地方面迈出关键一步。当前,国产大模型正迎来密集更新潮,技术向垂直领域纵深发展,市场竞争日趋激烈。
2026年5月18号 14:36
618.4k
