阿里Wan 2.2即將震撼上線：開源視頻生成AI挑戰Sora

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 26, 2025

阿里巴巴雲宣佈其備受期待的視頻生成AI模型Wan2.2即將在近期正式發佈。作爲Wan2.1的升級版本，Wan2.2預計在性能、效率和功能上實現重大突破，繼續秉承阿里開源AI的戰略，鞏固其在全球AI視頻生成領域的領先地位。繼Wan2.1於2025年2月開源並取得廣泛成功後，Wan2.2的推出引發了開發者社區和行業的熱烈討論。

Wan2.2:技術升級，性能再突破

Wan2.1憑藉其時空變分自編碼器（VAE）和擴散變換器（DiT）架構，已在VBench基準測試中以84.7%的得分超越OpenAI的Sora（84.28%）。據社交媒體討論，Wan2.2預計進一步優化這些技術，顯著提升視頻生成速度和質量，尤其是在高分辨率(如1080p)和長視頻生成中的表現。預計新增功能包括:

文本到視頻（T2V）:支持更高分辨率（如1080p和4K）以及更長的視頻生成，生成時間進一步縮短。
圖像到視頻（I2V）:提升動態場景的流暢性和真實性，支持更復雜的動作和場景轉換。
視頻到音頻（V2A）:增強從視頻內容生成匹配音頻的能力，提升多模態創作體驗。
多語言與風格擴展:支持更多語言的文本效果生成，並新增多樣化的藝術風格模板，如賽博朋克、寫實動畫等。
硬件優化:進一步降低硬件需求，T2V-1.3B模型預計在更低顯存（如6GB）設備上運行，擴大用戶覆蓋範圍。

Wan2.2的訓練數據預計在Wan2.1（15億視頻、100億圖像）的基礎上進一步擴充，優化數據篩選以提升生成內容的多樣性和真實性。

Wan2.2將繼續採用Apache2.0許可證，通過Alibaba Cloud ModelScope和Hugging Face免費提供代碼和模型權重，支持學術研究和商業應用。Wan2.1已推出T2V-1.3B、T2V-14B、I2V-14B-720P和I2V-14B-480P四種變體，Wan2.2預計將新增更多模型變體，針對不同硬件和場景進一步優化。

開發者對Wan2.2的開源前景充滿期待，認爲其將進一步挑戰OpenAI Sora等封閉模型的市場主導地位，推動AI視頻生成技術的民主化。阿里此舉不僅降低了技術門檻，也爲全球開發者提供了更多創新空間。

OpenAI 即將發佈 GPT-5，預計在八月亮相

OpenAI CEO確認GPT-5將於8月發佈，整合o3推理能力並推出mini/nano版本。此前因測試延遲從5月推遲至8月，阿爾特曼透露GPT-5表現驚豔。7月底將先發布開放權重模型，這是自GPT-2後首次開源，具備先進推理能力。新模型將在多平臺開放訪問，延遲因安全測試所致。GPT-5將顯著提升AI性能，擴展應用場景。（140字）

訊飛星火X1深度推理大模型升級版上線多維度能力顯著提升

科大訊飛宣佈其基於全國產算力訓練的深度推理大模型——訊飛星火X1升級版正式上線。此次升級是一次全面的躍升，不僅在綜合能力上對標OpenAI的o3等國內外一流大模型最新版本效果保持領先，還在幻覺治理、多語言能力、語音同傳等多個方面取得了顯著進步，爲用戶提供了一個更智能、更可靠、更高效的AI助手。訊飛星火X1升級版在翻譯、推理、文本生成、數學等方面的能力大幅提升，特別是在幻覺治理方面取得了顯著進步。幻覺問題是大模型落地應用的關鍵難題之一，而星火X1在事實性幻覺治理和忠實性幻覺治理兩方面均取得了明顯進步，顯著提高了大模型行業落地應用的可靠性。此外，星火X1的多語言能力也得到了極大拓展，現已覆蓋130多種語種，爲用戶提供無障礙跨語言交流的能力。

浙大校友推出AI代碼測試神器，30分鐘打造無bug網站

浙江大學團隊開發的TestSprite2.0智能測試平臺實現重大突破，可在30分鐘內自動創建無bug網站，AI生成代碼準確率達93%。該平臺通過分析項目文檔自動生成測試計劃，完成測試用例生成、代碼編寫、腳本執行全流程，並反饋結構化報告。特別適用於AI編程，能自動測試、調試和修復Trae等平臺代碼。新增的智能調度功能支持跨時區自動化測試和實時質量監控，已獲6000多個開發團隊採用，將徹底改變軟件開發模式。

快手開源KAT-V1大模型：自動思考能力顯著提升，40B版本性能接近40B 性能逼近 R1-0528

快手開源KAT-V1自動思考大模型，包含40B和200B兩個版本。40B版本性能接近DeepSeek-R1，200B版本超越多個旗艦模型。該模型創新性地採用長短思考混合訓練範式和Step-SRPO強化學習算法，能根據問題複雜度自動調整思考模式，解決過度思考問題。基於Qwen2.5-32B擴展，通過異構蒸餾框架和1000萬示例預訓練，在科學、代碼等領域表現優異。40B版本已在Hugging Face上線，200B版本仍在訓練中。

Figma Make 面向所有用戶開放:AI賦能設計，效率觸手可及

Figma宣佈其AI設計工具Figma Make全面開放，支持自然語言生成應用原型。所有用戶均可體驗基礎功能，但完整發布需升級"Full Seat"訂閱。該工具支持上傳設計參考圖輔助AI生成，並提供精細化編輯功能。同時Figma推出AI積分系統，按會員等級分配使用額度，"Full Seat"用戶暫享無限額度。平臺還整合了圖像生成、編輯及畫質提升等AI功能，構建完整的設計輔助生態。

谷歌Lab重磅新品Opal：零代碼！用自然語言打造AI應用，解鎖未來生產力

谷歌實驗室推出實驗性AI工具Opal，支持零代碼開發AI應用。該工具通過自然語言指令和可視化編輯器，讓用戶無需編程即可構建AI驅動的迷你應用。核心功能包括自然語言驅動、可視化工作流編輯、谷歌AI生態集成及協作分享。目前僅限美國IP用戶公測，未來或向全球開放。Opal降低了AI開發門檻，是谷歌推動AI民主化的重要嘗試，有望重塑AI應用開發格局。