阿里開源通義萬相Wan2.2:全球首個MoE架構視頻生成模型震撼發佈

阿里巴巴今晚正式開源視頻生成模型"通義萬相Wan2.2"，此次發佈包含三款核心模型:文生視頻（Wan2.2-T2V-A14B）、圖生視頻(Wan2.2-I2V-A14B)和統一視頻生成(Wan2.2-IT2V-5B)模型，標誌着視頻生成技術迎來重大突破。

業界首創MoE架構，計算效率提升50%

通義萬相2.2率先在視頻生成擴散模型中引入MoE（Mixture of Experts）架構，有效解決了視頻生成處理Token過長導致的計算資源消耗過大問題。其中文生視頻和圖生視頻模型總參數量達27B，激活參數14B，均爲業界首個使用MoE架構的視頻生成模型。

該架構由高噪聲專家模型和低噪專家模型組成，分別負責視頻的整體佈局和細節完善。在同參數規模下，可節省約50%的計算資源消耗，同時在複雜運動生成、人物交互、美學表達等維度上實現顯著提升。

首創電影美學控制系統

Wan2.2的一大亮點是首創的"電影美學控制系統"，在光影、色彩、構圖、微表情等方面達到專業電影水平。用戶通過輸入"黃昏"、"柔光"、"邊緣光"、"暖色調"、"中心構圖"等關鍵詞，模型可自動生成金色落日餘暉的浪漫畫面;而使用"冷色調"、"硬光"、"平衡圖"、"低角度"的組合，則能生成接近科幻片的畫面效果。

消費級顯卡即可部署的5B統一模型

通義萬相還開源了一款5B小尺寸的統一視頻生成模型，單一模型同時支持文生視頻和圖生視頻功能。該模型採用高壓縮率3D VAE架構，時間與空間壓縮比達到4×16×16，信息壓縮率提升至64，均實現開源模型的最高水平。

該模型僅需22G顯存（單張消費級顯卡）即可在數分鐘內生成5秒高清視頻，是目前24幀每秒、720P像素級生成速度最快的基礎模型，大幅降低了AI視頻生成的技術門檻。

多渠道開放使用

開發者可在GitHub、HuggingFace、魔搭社區下載模型和代碼，企業可通過阿里雲百鍊調用模型API，普通用戶還可在通義萬相官網和通義APP直接體驗。

自今年2月以來，通義萬相已連續開源文生視頻、圖生視頻、首尾幀生視頻和全能編輯等多款模型，在開源社區的下載量已超500萬次，爲AI視頻生成技術的普及和發展做出重要貢獻。

開源地址:

GitHub:https://github.com/Wan-Video/Wan2.2

HuggingFace:https://huggingface.co/Wan-AI

魔搭社區:https://modelscope.cn/organization/Wan-AI

階躍星辰推出全新基礎大模型 Step 3，參數量高達321B

階躍星辰發佈新一代Step3大模型，將於7月31日開源。這款321B參數的多模態推理模型在智能性、推理效率方面表現突出，支持跨領域知識理解和視覺分析。公司聯合芯片廠商成立"模芯生態創新聯盟"，並與上海國資達成戰略合作，推動大模型應用落地。Step3在國產芯片上推理效率達競品300%，吞吐量提升超70%，並建立"1+N"模型矩陣覆蓋多領域。該模型在多個榜單取得SOTA成績，具備強智能、低成本、可開源等特徵。

Anthropic 開始限制 Claude Code Max 用戶使用，引發開發者熱議

Anthropic突然對Claude Code實施嚴格使用限制，引發開發者強烈不滿。200美元/月的Max計劃用戶受影響最嚴重，許多人在未獲預警情況下遭遇使用中斷。新規針對全天候運行的重度用戶，但具體限額標準模糊不清。開發者抱怨高額月費與受限使用形成反差，30分鐘操作就觸發900條消息限額。雖然官方稱僅影響5%用戶，但缺乏透明溝通導致信任危機。Anthropic解釋此舉是爲遏制賬戶共享，承諾Max用戶仍享有優先訪問權。此次事件折射出AI服務在快速發展中面臨的透明度與用戶體驗平衡難題。

特斯拉與三星達成 165 億美元 AI 芯片合作

特斯拉與三星達成165億美元協議，三星將在德州新廠爲其生產下一代AI6芯片。該芯片將用於自動駕駛、Optimus機器人和AI訓練等領域。馬斯克透露特斯拉剛完成與臺積電合作的AI5芯片設計，同時三星已在生產AI4芯片。此次合作對三星意義重大，實際採購額可能遠超協議金額。特斯拉自2019年從英偉達轉向自研芯片，現正加速向AI科技公司轉型，這一戰略或將重塑汽車和科技行業格局。

中國電信推出天翼AI智能眼鏡：1999元支持拍攝、語音交互

中國電信近日正式推出其首款智能眼鏡——天翼AI智能眼鏡，定價1999元，以輕量化設計與多功能集成切入消費電子市場。這款產品採用超輕半框結構，整機重量僅38克，配合可調節鼻託與外擴幅度達15度的彈性鏡腿，可自適應不同臉型弧度。其8度人體工學前傾角設計，旨在降低長時間佩戴時的視覺疲勞感。

谷歌推出 Opal：用自然語言輕鬆構建 AI 應用

谷歌推出實驗性AI工具Opal，用戶通過自然語言描述即可創建迷你應用。該工具提供可視化編輯器，支持調整提示、添加功能或使用模板，無需編程基礎即可快速構建原型應用。完成的應用可通過鏈接分享，目前僅限美國使用。此舉順應無代碼AI平臺趨勢，與Cursor、Lovable等新興工具類似，旨在降低應用開發門檻。儘管仍處測試階段，Opal展現了谷歌對自然語言編程前景的信心，爲未來軟件開發方式提供新可能。