8月25日,阿里雲推出大規模視覺語言模型Qwen-VL,支持中英文多語種,具備文本和圖像的聯合理解能力。Qwen-VL基於阿里雲此前開源的通用語言模型Qwen-7B,相較其他視覺語言模型,Qwen-VL新增了視覺定位、圖像中文字理解等能力。Qwen-VL已在GitHub獲得3400多星,下載量超過40萬。視覺語言模型被視爲通用AI的重要演進方向。業界認爲,支持多模態輸入的模型能提升對世界的理解能力,拓展使用場景。阿里雲通過Qwen-VL的開源,進一步推動通用AI技術的進步。
阿里雲通義千問再開源:多模態大模型Qwen-VL
