阿里開源視頻生成模型Wan 2.1上線即屠榜 4070可流暢運行

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 21, 2025

近日，阿里巴巴在深夜推出了全新的開源視頻生成模型 Wan2.1，該模型憑藉14B 的參數量迅速佔據了 VBench 榜單的頂端，成爲目前視頻生成領域的佼佼者。與此之前發佈的 QwQ-Max 不同，Wan2.1在複雜運動的細節處理上表現出色，能夠流暢地實現多個人物的同步舞蹈，令人驚歎不已。

官方演示中，Wan2.1不僅成功克服了靜態圖像生成中的難題，如文字的處理更是達到了新的高度。對於普通用戶來說，雖然14B 的參數在個人消費級顯卡上部署較爲困難，但阿里還特別推出了一個1.3B 的小版本，支持480P 分辨率，使用12GB 顯存的4070顯卡即可流暢運行。

大腦大模型

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

除了14B 和1.3B 版本，阿里還發布了兩個額外的視頻生成模型，均採用 Apache2.0協議，意味着用戶可以免費商用。在實際操作中，用戶可以通過阿里提供的平臺訪問這款模型，快速生成視頻，但由於用戶量激增，有時可能會出現等待時間過長的情況。對於有一定技術基礎的用戶，還可以通過 HuggingFace 和魔搭社區等多種途徑自行安裝和調試。

Wan2.1最大的亮點在於其技術創新。該模型採用了 Diffusion Transformer 架構，並使用3D 變分自動編碼器，專門爲視頻生成設計。通過引入多種壓縮和並行策略，該模型在保證質量的同時，大幅度提高了生成效率。研究表明，Wan 的重建速度是當前同類技術的2.5倍，大大節省了計算資源。

在用戶體驗方面，Wan2.1也獲得了衆多好評。無論是生成動態場景中的細節，還是自然的物理效果，模型的表現都讓人眼前一亮。用戶們通過該模型不僅能夠製作出高質量的視頻作品，還能輕鬆實現文字的動態呈現，爲創作帶來了更多可能。

阿里巴巴的 Wan2.1模型不僅技術先進，而且爲廣大創作者提供了更多的創作自由度，標誌着視頻生成技術的又一突破。

DeepSeek開源第四天發佈並行策略升級:DualPipe與EPLB技術推動大模型訓練革命

今日，國內人工智能領軍企業DeepSeek正式公開其開源計劃的第四日成果——Optimized Parallelism Strategies（優化並行策略），重點推出雙向管道並行算法DualPipe、專家並行負載均衡器EPLB，以及對計算-通信重疊機制的深度優化。此次技術升級直擊大規模語言模型訓練的核心痛點，爲超萬卡級集羣的高效運行提供了全新解決方案。1. DualPipe:雙向管道並行算法作爲本次升級的核心技術之一，DualPipe專爲V3/R1架構設計，通過創新的雙向數據流管道，實現計算與通信的高度重疊。相較於傳統單向流水線，該

Hugging Face 推出 FastRTC：實時語音視頻應用開發變得輕而易舉

AI 初創公司 Hugging Face 宣佈推出 FastRTC，這是一個開源的 Python 庫，旨在消除開發人員在構建實時音頻和視頻 AI 應用時面臨的重大障礙。Hugging Face 的 FastRTC 旨在簡化 WebRTC 和 Websocket 應用的構建過程。Freddy Boulton，FastRTC 的創建者之一表示:“在 Python 中，構建實時 WebRTC 和 Websocket 應用非常困難，直到現在纔有所改變。”WebRTC 技術使得瀏覽器之間可以直接進行音頻、視頻和數據的共享，而無需下載插件或軟件。然而，儘管 WebRTC 在現代語音助手和視頻工具中至關重要，實現這一技術一直是一個

19歲女棋手因AI作弊，被中國圍棋協會重罰禁賽8年

中國圍棋協會日前發佈通報，對職業棋手秦思玥（2006年生）在全國圍棋錦標賽（個人）女子組比賽中作弊行爲做出嚴厲處罰。通報顯示，秦思玥在2024年12月15日的比賽中被發現攜帶手機，並利用人工智能程序作弊。經調查，秦思玥不僅在賽前藏匿手機，還在比賽過程中實施作弊，且在被詢問時隱瞞事實，情節嚴重。圖源備註：圖片由AI生成，圖片授權服務商Midjourney中國圍棋協會認爲，秦思玥的行爲嚴重違反賽場紀律，破壞行業風氣，決定撤銷其職業段位，取消其在2024年全國圍棋錦標賽（個

AI工具在大學生中普及老師表示AI作文全判0分

近期，央視新聞報道指出，AI工具已成爲大學生完成報告、論文的“神器”。然而，這一現象也引發了學術不端行爲的擔憂。一些高校教師和專家表示，少數學生利用AI僞造研究數據、編輯實驗圖片等，嚴重影響了學術誠信。某高校作業羣通知顯示，教師明確規定AI直接生成的作文一律按零分處理。圖源備註：圖片由AI生成，圖片授權服務商Midjourney長江日報的調查顯示，近六成高校師生頻繁使用生成式AI，其中近三成大學生主要用於撰寫論文或作業。教育部信息網絡工程研究中心科研助理丁

極氪智能科技首創汽車座艙端側AI大模型離線部署

在智能汽車領域，極氪智能科技日前宣佈了一個引人注目的成就:成功完成了汽車行業首個端側 AI 大模型的離線部署。這一技術的實現，不僅意味着極氪在汽車智能化進程中邁出了重要一步，更是爲用戶帶來了全新的駕駛體驗。通過這一技術，極氪汽車將能夠在不依賴網絡的情況下，實時進行圖文理解與推理，大大提升了車輛的智能化水平。據瞭解，極氪計劃通過 OTA（空中升級）技術，分批推送這一新技術，預計在2025年內，將其應用於8295座艙平臺的全品類車型。這一戰略部署將使得極氪

字節跳動悟空瀏覽器接入DeepSeek R1模型，或爲抖音接入鋪路

字節跳動旗下悟空瀏覽器近日正式接入DeepSeek R1模型，這一舉措引發業界廣泛關注。與此前飛書、火山引擎接入DeepSeek不同，悟空瀏覽器作爲面向C端用戶的產品，融合了抖音與番茄小說等內容，其接入被認爲可能爲抖音未來接入DeepSeek鋪路。目前，悟空瀏覽器同時搭載豆包與DeepSeek兩大模型，DeepSeek R1主要負責智能對話與文本生成，而豆包則提供AI快捷功能，應用場景更爲廣泛。悟空瀏覽器曾經歷多次迭代，從最初的“賺錢瀏覽器”發展爲集成搜索、內容推薦與AI輔助的多功能瀏覽器。此次接