阿里通義千問團隊推出Qwen2-VL模型支持實時分析動態視頻

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 21, 2025

阿里巴巴達摩院的通義千問團隊在2024年8月30日宣佈了其最新成果——Qwen2-VL模型的重大更新。Qwen2-VL模型在圖像理解、視頻處理和多語言支持方面均實現了顯著提升，爲關鍵性能指標設定了新的基準。

Qwen2-VL模型的新功能包括增強的圖像理解能力，能夠更準確地理解和解釋視覺信息;高級視頻理解能力，使得模型能夠實時分析動態視頻內容;集成的可視化agent功能，將模型轉變爲能夠進行復雜推理和決策的強大代理;以及擴展的多語言支持，使其在不同語言環境中更易於訪問和有效。

微信截圖_20240830075330.png

在技術架構上，Qwen2-VL實現了動態分辨率支持，能夠處理任意分辨率的圖像，無需將其分割成塊，從而確保模型輸入與圖像固有信息之間的一致性。此外，Multimodal Rotary Position Embedding （M-ROPE）的創新，使得模型能夠同時捕獲和集成1D文本、2D視覺和3D視頻位置信息。

Qwen2-VL-7B模型在7B規模下成功保留了對圖像、多圖像和視頻輸入的支持，並在文檔理解任務和圖像多語言文本理解方面表現出色。

同時，團隊還推出了針對移動部署優化的2B模型，儘管參數量只有2B，但在圖像、視頻和多語言理解方面表現突出。

模型鏈接:

Qwen2-VL-2B-Instruct:https://www.modelscope.cn/models/qwen/Qwen2-VL-2B-Instruct

Qwen2-VL-7B-Instruct:https://www.modelscope.cn/models/qwen/Qwen2-VL-7B-Instruct

智譜發佈新一代基座模型GLM-4-Plus 清言APP升級視頻通話功能

北京智譜華章科技有限公司在2024年8月29日宣佈了一系列重要的技術更新，包括新一代基座模型的發佈和新的應用服務。在KDD2024大會上，智譜發佈了包括語言模型GLM-4-Plus、文生圖模型CogView-3-Plus、圖像/視頻理解模型GLM-4V-Plus和視頻生成模型CogVideoX在內的新一代基座模型。這些模型在各自領域均達到了國際領先水平。

Aug 30, 2024

238.1k

韓國深度僞造犯罪引發社會恐慌，未成年人成AI換臉主要受害者

韓國深度僞造犯罪問題引發社會廣泛關注，尤其針對未成年人的案例頻發，涉及人數估計近22萬。受害羣體廣泛，包括學生、教師、軍人等，其中未成年人比例較高。犯罪手段通過社交媒體迅速傳播，部分受害者信息被用於不法羣組的驗證。針對女性的深度僞造案件特別引人關注，已知受害學校超過100所，涵蓋國內和海外韓國國際學校。對此，韓國總統呼籲加強調查和根除利用數字技術進行的犯罪行爲，並強調政府需採取更有力措施打擊此類犯罪，同時加強法治教育，保護女性權益。社會各界對此表示強烈關注，要求政府立即採取行動。

Aug 29, 2024

345.0k

AI推理芯片戰火重燃英偉達Blackwell芯片稱霸MLPerf

本文概述了AI推理芯片領域的最新發展，特別是MLPerf推理v4.1競賽的結果，該競賽彙集了來自AMD、谷歌、UntetherAI、Cerebras、FuriosaAI以及Nvidia等公司的最新芯片。Nvidia的H200和GH200芯片在“數據中心封閉”類別中保持領先，但其他公司的芯片在特定任務上表現出色，尤其是在能效方面。AMD的Instinct加速器、谷歌的Trillium加速器以及UntetherAI的speedAI240預覽芯片在不同任務上表現出色，顯示了市場上的競爭激烈。UntetherAI的芯片採用內存計算方法，顯示出在能效和延遲方面有顯著優勢。Cerebras和FuriosaAI雖然沒有參加MLPerf，但也發佈了新芯片，分別展示了其在內存帶寬和張量收縮處理器方面的創新。IBM的Spyre芯片則爲即將到來的市場增添了新的競爭者。整體而言，AI推理芯片市場的競爭日益激烈，創新技術不斷涌現，旨在提高性能、能效和成本效益。

Aug 29, 2024

176.3k

美圖公司上半年業績驚豔：AI助力淨利潤同比暴漲 80.3%

美圖公司2024年上半年財報顯示，總收入16.2億元，同比增長28.6%，經調整後歸母淨利潤2.7億元，增長80.3%。收入和淨利潤增長主要得益於生成式AI技術的提升，尤其在影像與設計產品上的應用，付費訂閱業務收入9.3億元，同比增長54.5%，佔總收入57.4%。截至6月30日，付費訂閱用戶數超1081萬，付費滲透率約爲4.2%。美圖設計室專注於電商設計AI工作流，收入同比增長超152%。在研發投入上，美圖上半年投入4.3億元，同比增長44.5%，已註冊484項專利，持有266項軟件產品著作權。其生成式AI大模型MiracleVision升級至V5版本，通過《生成式人工智能服務管理暫行辦法》備案，並全面應用於美圖旗下產品，助力多行業工作效率提升。

Aug 29, 2024

124.5k

AI除草機器人來了！美國愛達荷大學自主研發精準除草

愛達荷大學Coeur d’Alene分校的計算機科學研究團隊研發了一款自主機器人，利用人工智能精準除草，實現對半英寸寬雜草的識別與精確打擊，通過電擊根除。此機器人在林務局Coeur d’Alene樹苗培育場演示後，計劃改進硬件與電氣組件，提升AI識別雜草的準確性。該項目與美國農業部合作，旨在提高國家森林系統的再造林效率，減少勞動力成本和化學農藥使用，增強本地植物適應性。該機器人作爲Project Evergreen項目的一部分，獲得了USDA的資助。通過與林務局的合作，旨在實現國家森林的可持續目標，符合REPLANT法案要求，在未來十年內再造林400萬英畝，種植超過12億棵樹。

Aug 29, 2024

127.0k

LG 推出新款智能家居中ThinQ ON 內置AI語音助手

LG將在IFA2024科技展上首發其首款專用智能家居中心ThinQ ON，該設備採用人工智能技術，支持Thread、Matter和Wi-Fi連接，能控制LG及第三方品牌的智能家居設備。外觀小巧圓潤，內置AI語音助手，具備理解自然語言、解析上下文和學習用戶偏好能力，提供個性化智能家居體驗。ThinQ ON作爲集線器和智能音箱，由LG自主研發的AI芯片組驅動，已通過Matter認證，兼容多種網絡連接和設備。此次發佈標誌着LG正式進軍全面智能家居平臺市場，產品將通過LG的ThinQ應用程序管理，支持自動化例程和Matter協議，實現與Google Home Hub的兼容。ThinQ ON的定價和上市時間尚未公佈，但預計將對LG的智能家居戰略產生重要影響。

Aug 29, 2024

108.3k

阿里通義千問團隊推出Qwen2-VL模型 支持實時分析動態視頻

相關AI新聞推薦

智譜發佈新一代基座模型GLM-4-Plus 清言APP升級視頻通話功能

​韓國深度僞造犯罪引發社會恐慌，未成年人成AI換臉主要受害者

AI推理芯片戰火重燃 英偉達Blackwell芯片稱霸MLPerf

美圖公司上半年業績驚豔：AI助力淨利潤同比暴漲 80.3%

​AI除草機器人來了！美國愛達荷大學自主研發 精準除草

LG 推出新款智能家居中ThinQ ON 內置AI語音助手

阿里通義千問團隊推出Qwen2-VL模型支持實時分析動態視頻

韓國深度僞造犯罪引發社會恐慌，未成年人成AI換臉主要受害者

AI推理芯片戰火重燃英偉達Blackwell芯片稱霸MLPerf

AI除草機器人來了！美國愛達荷大學自主研發精準除草