8月25日,阿里雲推出大規模視覺語言模型Qwen-VL,支持中英文多語種,具備文本和圖像的聯合理解能力。Qwen-VL基於阿里雲此前開源的通用語言模型Qwen-7B,相較其他視覺語言模型,Qwen-VL新增了視覺定位、圖像中文字理解等能力。Qwen-VL已在GitHub獲得3400多星,下載量超過40萬。視覺語言模型被視爲通用AI的重要演進方向。業界認爲,支持多模態輸入的模型能提升對世界的理解能力,拓展使用場景。阿里雲通過Qwen-VL的開源,進一步推動通用AI技術的進步。
相關推薦
AI 浪潮助攻!阿里雲中國市場份額升至 36%,連續三季度增長穩坐“頭把交椅”
全球AI需求激增推動中國雲計算市場格局變化。阿里雲2025年第三季度市場份額從34%升至36%,連續三個季度增長,AI成爲其核心增長動力。
Feb 11, 2026
144.2k
挖掘視頻“暗數據”!谷歌前員工創辦 InfiniMind,助企業解鎖 PB 級視頻資產
東京初創公司InfiniMind獲580萬美元種子輪融資,由前谷歌員工創立,致力於開發AI基礎設施,將海量未利用的視頻音頻“暗數據”轉化爲可搜索的結構化商業智能,應對企業數據處理挑戰。
Feb 10, 2026
138.7k
生圖編輯合二爲一!Qwen-Image-2.0發佈:2K 極致質感挑戰視覺極限
阿里雲於2026年2月10日發佈新一代圖像生成基礎模型Qwen-Image-2.0,實現了圖像生成與編輯功能的融合。該模型採用7B輕量化架構,在保持高速推理的同時,具備四大核心優勢:專業的文字渲染能力,支持高達1k token的超長複雜指令處理,並在多項盲測基準中表現卓越。
Feb 10, 2026
310.2k
一張打印紙竟能“劫持”自動駕駛:視覺語言模型暴露嚴重安全漏洞
自動駕駛汽車依賴路標識別,但加州大學研究揭示其致命弱點:攻擊者通過打印特定文本的標識,就能利用視覺語言模型漏洞,誘導車輛做出危險決策,甚至駛向行人。這種“CHAI”攻擊暴露了AI系統對視覺指令的過度依賴風險。
Feb 2, 2026
142.4k
阿里平頭哥自研 AI 芯片“真武 810E”發佈
阿里平頭哥發佈高端AI芯片“真武810E”,性能超越英偉達A800及主流國產GPU,與H20相當。該芯片採用自研架構和互聯技術,標誌着阿里AI戰略“通雲哥”正式成型。
Jan 29, 2026
174.3k
