阿里雲開源了視覺語言模型Qwen-VL,這是繼8月開源通用模型Qwen-7B和對話模型Qwen-7B-Chat之後,又一個開源的大模型。Qwen-VL支持中英文,可以進行知識問答、圖像標題生成、圖像問答等多種應用。相比其他模型,Qwen-VL可以進行中文開放域定位,在圖像中準確標註檢測框。Qwen-VL基於Qwen-7B研發,引入視覺編碼器,支持圖像輸入。Qwen-VL在多項視覺語言任務中的測試中,取得了同等模型最好的效果。Qwen-VL已在ModelScope等平臺開源。多模態是大模型發展的重要方向,仍面臨一定技術挑戰。
相關推薦
知乎2025年度 AI 產品榜單揭曉,豆包位居榜首
知乎發佈2025年度AI產品榜單,通過用戶反饋與專業評估,爲市場趨勢提供權威參考。榜單中,字節跳動豆包獲“知友年度愛用”榜首,展現其市場領先地位。
Dec 24, 2025
165.8k
愛詩科技與阿里雲簽署全面合作協議 推動 AI 視頻全球化發展
愛詩科技與阿里雲簽署全面合作協議,雙方將在AI視頻生成領域展開深度合作,涵蓋模型、算力、產品、生態及商業等多個層面,共同推動技術發展。阿里雲將爲愛詩科技提供基礎設施支持,助力其全球化佈局。
Dec 17, 2025
113.2k
23天狂飆3000萬月活!阿里通義千問直接“免費放大招”,PPT、寫作、文庫、講題全線免費用
阿里通義千問公測23天月活突破3000萬,創國內大模型最快增長紀錄。同時宣佈四大生產力功能——AI PPT、AI寫作、AI文庫、AI講題永久免費開放,零門檻無限制,引發廣泛關注。用戶反饋顯示,市場更青睞能解決實際問題的“生產力神器”,而非僅能聊天的AI。
Dec 10, 2025
209.8k
杭州瞳行科技發佈國內首款AI助盲眼鏡,3000元內實現300毫秒路況播報
瞳行科技推出國內首款AI助盲眼鏡,集成阿里通義千問大模型,爲視障人士提供實時出行輔助。產品由眼鏡、手機、遙控指環和盲杖協同工作,通過雙攝像頭實現300毫秒低延遲路況播報,支持識別公交牌、路標及環境概述。技術總監陳剛表示,大模型壓縮70%研發成本,加速算法落地。眼鏡還具備本地文本識別功能。
Dec 3, 2025
148.9k
NeurIPS 2025 最佳論文揭曉:阿里通義千問靠“門控注意力”摘下中國唯一大獎
阿里巴巴通義千問團隊在NeurIPS 2025獲最佳論文獎,論文《Attention Gating Makes Better Foundation Models》提出“滑動門”機制,在標準注意力後添加可學習門控,動態篩選關鍵頭和token參與下游計算。實驗證明,1.7B稠密模型性能媲美15B MoE模型。本屆大會投稿2萬篇,錄取率僅25%,競爭激烈,該論文是四篇獲獎作品中唯一中國成果。
Nov 28, 2025
354.1k
