阿里雲 Qwen2.5-1M 開源發佈:100萬上下文長度模型登場

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 21, 2025

繼 DeepSeek R1之後，阿里雲通義千問團隊剛剛宣佈推出其最新的開源模型 Qwen2.5-1M，再次引發業界關注。

此次發佈的 Qwen2.5-1M 系列包含兩個開源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。這是通義千問首次推出能夠原生支持百萬Token上下文長度的模型，並在推理速度上實現了顯著提升。

阿里雲、通義千問

Qwen2.5-1M 的核心亮點在於其原生支持百萬 Token 的超長上下文處理能力。這使得模型能夠輕鬆應對書籍、長篇報告、法律文件等超長文檔，無需進行繁瑣的分割處理。同時，該模型還支持更長時間、更深入的對話，能夠記住更長的對話歷史，實現更連貫、更自然的交互體驗。此外，Qwen2.5-1M 在理解複雜任務，如代碼理解、複雜推理、多輪對話等方面也展現出更強大的能力。

除了令人震撼的百萬Token上下文長度，Qwen2.5-1M 還帶來了另一項重大突破:閃電般快速的推理框架!通義千問團隊完全開源了基於 vLLM 的推理框架，並集成了稀疏注意力機制。這一創新性的框架使得 Qwen2.5-1M 在處理百萬 Token 輸入時，速度提升了 3倍到7倍!這意味着用戶可以更加高效地使用超長上下文模型，極大地提升了實際應用場景的效率和體驗。

宇樹科技人形機器人亮相央視春晚表演節目《秧Bot》

中央廣播電視總檯《2025年春節聯歡晚會》在多個電視頻道直播。杭州宇樹科技攜旗下人形機器人登上春晚舞臺，帶來了一場別開生面的表演節目《秧Bot》。該節目由著名導演張藝謀執導，將傳統文化與機器人技術完美融合。在節目中，宇樹科技的多個人形機器人穿上紅色大花襖，手持手絹跳起了秧歌。這些機器人不僅實現了極爲柔順的行走，還能與舞者完美配合互動，精準完成轉手絹等複雜動作，展現了高度的靈活性和精準性。宇樹科技官網顯示，登上春晚舞臺的是Unitree H1/H1-2人形機器人

阿里雲通義開源Qwen2.5-VL，視覺AI超越Claude 3.5

阿里雲通義千問開源了全新的視覺模型Qwen2.5-VL，並推出了3B、7B和72B三個尺寸版本。其中，旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍，超越了GPT-4o與Claude3.5。阿里雲官方介紹稱，新的Qwen2.5-VL能夠更準確地解析圖像內容，並突破性地支持超過1小時的視頻理解。該模型可以在視頻中搜索具體事件，並對視頻的不同時間段進行要點總結，從而快速、高效地幫助用戶提取視頻中的關鍵信息。此外，Qwen2.5-VL無需微調即可變身爲一個能操控手機和電腦的AI視覺智能體（Visual Agents），實現多

英偉達點贊DeepSeek：是“出色的人工智能進步”

國產大模型公司DeepSeek的應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜，超越了ChatGPT。這一成就不僅引起了市場的廣泛關注，也對AI芯片龍頭英偉達的股價產生了重大影響。儘管如此，英偉達發言人仍然對DeepSeek給出了高度評價，稱其爲AI領域的一項卓越進步，並指出DeepSeek的工作展示瞭如何利用測試時間縮放技術、廣泛可用的模型以及符合出口管制的計算資源來創建新型號。英偉達發言人補充道，推理過程需要大量英偉達GPU和高性能網絡支持。英偉達目前掌握三種擴展規律

ChatGPT迴應DeepSeek超越:排名變化或爲暫時現象

DeepSeek應用超越ChatGPT，登頂蘋果美國區免費App下載排行榜，引發市場熱議。這家被稱爲“大模型版拼多多”的中國公司，其應用的快速上升讓海內外技術同行和投資機構都密切關注。對於這一排名變化，ChatGPT迴應稱，DeepSeek可能在某些方面有獨特優勢或滿足了用戶特定需求，但這樣的排名變化也許是暫時的，同時也表明AI應用市場競爭激烈，創新空間巨大。在國外大模型排名榜Chatbot Arena上，DeepSeek-R1的基準測試排名已升至全類別大模型第三，與OpenAI的ChatGPT-4o最新版並列。劃重點: 📈 DeepSee

DeepSeek稱遭到大規模惡意攻擊，註冊或受影響

DeepSeek發佈公告稱其線上服務近期遭受了大規模惡意攻擊，導致註冊過程可能變得繁忙。DeepSeek提醒用戶，如果遇到註冊困難，可以稍等後重試。已註冊用戶可以正常登錄，不受影響。此外，有報道稱DeepSeek曾暫時限制了非86手機號的註冊方式，但已註冊用戶登錄不受影響。DeepSeek作爲當前最熱門的大模型之一，在主流榜單中，其DeepSeek-V3在開源模型中位列榜首，與世界上最先進的閉源模型不相上下。DeepSeek的創始人梁文鋒在接受媒體採訪時表示，中國AI不可能永遠處於跟隨的位置。他指出，中

DeepSeek深夜再放大招，發佈全新多模態大模型Janus-Pro

國產大模型DeepSeek發佈了全新的Janus-Pro多模態大模型，正式進軍文生圖領域。這一舉動標誌着DeepSeek在多模態AI技術上的重大突破。在GenEval和DPG-Bench基準測試中，Janus-Pro-7B不僅擊敗了OpenAI的DALL-E3，還超越了Stable Diffusion、Emu3-Gen等熱門模型。Janus-Pro採用MIT開源協議，這意味着它可以無限制地用於商業場景。DeepSeek表示，Janus-Pro是2024年11月13日發佈的JanusFlow大模型的高級版本。相比前代模型，Janus-Pro優化了訓練策略，擴展了訓練數據，並且模型規模更大。這些改進使得Janus-Pro在多模態理解和文本