8月25日,阿里云推出大规模视觉语言模型Qwen-VL,支持中英文多语种,具备文本和图像的联合理解能力。Qwen-VL基于阿里云此前开源的通用语言模型Qwen-7B,相较其他视觉语言模型,Qwen-VL新增了视觉定位、图像中文字理解等能力。Qwen-VL已在GitHub获得3400多星,下载量超过40万。视觉语言模型被视为通用AI的重要演进方向。业界认为,支持多模态输入的模型能提升对世界的理解能力,拓展使用场景。阿里云通过Qwen-VL的开源,进一步推动通用AI技术的进步。
相关推荐
AI 浪潮助攻!阿里云中国市场份额升至 36%,连续三季度增长稳坐“头把交椅”
全球AI需求激增推动中国云计算市场格局变化。阿里云2025年第三季度市场份额从34%升至36%,连续三个季度增长,AI成为其核心增长动力。
2026年2月11号 11:43
137.7k
挖掘视频“暗数据”!谷歌前员工创办 InfiniMind,助企业解锁 PB 级视频资产
东京初创公司InfiniMind获580万美元种子轮融资,由前谷歌员工创立,致力于开发AI基础设施,将海量未利用的视频音频“暗数据”转化为可搜索的结构化商业智能,应对企业数据处理挑战。
2026年2月10号 18:01
137.7k
生图编辑合二为一!Qwen-Image-2.0发布:2K 极致质感挑战视觉极限
阿里云于2026年2月10日发布新一代图像生成基础模型Qwen-Image-2.0,实现了图像生成与编辑功能的融合。该模型采用7B轻量化架构,在保持高速推理的同时,具备四大核心优势:专业的文字渲染能力,支持高达1k token的超长复杂指令处理,并在多项盲测基准中表现卓越。
2026年2月10号 15:04
296.1k
一张打印纸竟能“劫持”自动驾驶:视觉语言模型暴露严重安全漏洞
自动驾驶汽车依赖路标识别,但加州大学研究揭示其致命弱点:攻击者通过打印特定文本的标识,就能利用视觉语言模型漏洞,诱导车辆做出危险决策,甚至驶向行人。这种“CHAI”攻击暴露了AI系统对视觉指令的过度依赖风险。
2026年2月2号 16:42
142.4k
阿里平头哥自研 AI 芯片“真武 810E”发布
阿里平头哥发布高端AI芯片“真武810E”,性能超越英伟达A800及主流国产GPU,与H20相当。该芯片采用自研架构和互联技术,标志着阿里AI战略“通云哥”正式成型。
2026年1月29号 11:00
189.2k
