AI日報：可靈AI全量上線O1視頻大模型；千問APP接入萬相Wan2.5；PixVerse V5.5發佈

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、可靈AI今日全量上線O1 視頻大模型：統一多模態架構支持一句話生成視頻

可靈AI公司宣佈其自主研發的O1視頻大模型已全量開放，該模型採用MVL統一交互架構，支持文字、圖像、視頻三種指令輸入，並能一次性完成文生視頻、圖生視頻、局部編輯及鏡頭延展任務。此外，模型通過多視角主體構建技術解決鏡頭切換時的“特徵漂移”問題，確保畫面連貫。目前，O1模型已在可靈App及官網同步開放體驗，後續將開放API接口供第三方平臺集成。

【AiBase提要:】
🧠 O1視頻大模型採用MVL統一交互架構，支持文字、圖像、視頻三種指令輸入
🎬 一次性完成文生視頻、圖生視頻、局部編輯及鏡頭延展任務
📊 可靈AI計劃開放API接口，供第三方平臺集成

2、千問APP接入萬相Wan2.5，視頻能力全新升級

千問APP接入萬相Wan2.5模型，顯著提升了視頻創作能力，支持音視頻同步輸出，並允許用戶通過自定義圖片和文字生成高質量的動態視頻內容，進一步降低了創作門檻，激發了用戶的創意熱情。

【AiBase提要:】
🎥 千問APP接入萬相Wan2.5模型，視頻創作能力全面升級。
🎙️ 支持音視頻同時輸出，實現音畫同步的高質量視頻生成。
🔄 用戶可自定義上傳照片和文字，生成動態唱跳視頻，降低創作門檻。

3、PixVerse V5.5 發佈：支持「導演級」音畫同步

PixVerse V5.5版本的發佈，爲視頻製作帶來了重大變革。用戶只需輸入一句話即可生成帶聲音和口型同步的高清視頻，並支持多鏡頭自動切換，顯著提升了視頻創作的便捷性。

【AiBase提要:】
🎥 支持一句話生成高清視頻，實現音畫同步。
🔄 多鏡頭自動切換，提升視頻敘事邏輯。
🚀 自研架構提升視頻生成速度與質量，一站式服務。
詳情鏈接:https://pai.video

4、DeepSeek-V3.2 正式發佈：引入創新稀疏注意力架構，API 成本腰斬，性能比肩頂尖閉源模型

中國人工智能初創公司深度求索（DeepSeek AI）發佈了DeepSeek-V3.2系列模型，包括DeepSeek-V3.2及其高計算增強版DeepSeek-V3.2-Speciale。新模型引入了創新的稀疏注意力機制(DSA)，提升了長文本任務的效率，並降低了API成本。DeepSeek-V3.2-Speciale版本在高難度推理任務中表現出色，甚至超越了GPT-5。此外，該模型還提供了開源內核和演示代碼，支持研究人員和企業進行商業部署。

【AiBase提要:】
🧠 引入創新的稀疏注意力機制(DSA)，提升長文本任務效率。
🚀 DeepSeek-V3.2-Speciale版本在高難度推理任務中表現優異，超越GPT-5。
📊 API成本降低50%，支持研究人員和企業進行商業部署。
詳情鏈接:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

5、Runway 發佈全新 Gen-4.5視頻生成模型，提升創作與視覺質量

Runway 發佈了其最新的視頻生成模型 Gen-4.5，顯著提升了視覺準確性和創意控制，適用於社交媒體短視頻創作。儘管面臨競爭，Gen-4.5在物體和角色的一致性質量上表現突出，但也存在因果推理和時間連貫性的問題。同時，AI生成內容的真實性問題引發行業討論，建議添加免責聲明。

【AiBase提要:】
🎥 Runway 的 Gen-4.5模型使視頻生成更具創意和視覺一致性。
📱 該模型主要針對社交媒體短視頻，與其他競爭對手針對長視頻的戰略有所不同。
⚖️ AI 生成內容的真實性問題引發了行業內部的討論，建議添加免責聲明以區分真實與虛假。

6、谷歌 AI 搜索體驗“提速”:新設計實現無縫對話，Gemini3Pro 殺入120國市場!

谷歌公司正在採取一系列舉措，旨在讓其人工智能（AI）模式和功能更加普及和易用。一方面，谷歌正在測試新的設計，以優化用戶從 AI 概覽到 AI 模式的過渡體驗;另一方面，Gemini3Pro 模型正在進行大規模國際擴張。

【AiBase提要:】
💡優化AI體驗，實現無縫對話
🌍Gemini3Pro/Nano Banana Pro拓展至120個國家和地區
🚀提升用戶在Google搜索中的AI功能

7、Lovart Touch Edit 上線：輕點即改，AI 圖像編輯進入“零蒙版”時代

Lovart 推出的 Touch Edit 功能通過自然語言指令和智能識別技術，實現了圖像編輯的高效與便捷。用戶無需手動操作即可完成複雜的圖像修改任務，顯著提升了設計效率。

【AiBase提要:】
✨ Touch Edit 核心功能：通過自然語言指令實現圖像元素的自動識別與編輯。
🧩 Select & Remix 支持多圖混搭，用戶可拖拽重組不同圖片元素。
⚙️ 技術集成：融合 GPT-4o、Flux Pro 和 Sora 等模型，提供高效的 AI 工作流。

8、螞蟻數科Agentar入選中國智能體開發賽道“第一梯隊”

螞蟻數科的Agentar平臺憑藉技術架構的完整性、產品迭代的成熟度以及在金融領域的多年沉澱，成功躋身中國智能體開發賽道的‘第一梯隊’，展現了其在AI智能體開發領域的領先地位。

【AiBase提要:】
🧠 螞蟻數科的Agentar平臺在智能體開發領域展現出領先實力。
💼 該平臺在金融領域有豐富的技術經驗與規模化落地成果。
📈 Agentar-Fin-R1推理大模型在三項金融基準測試中位列第一。

AI日報：可靈AI全量上線O1視頻大模型；千問APP接入萬相Wan2.5；PixVerse V5.5發佈

相關推薦

AI 智能體 Elements Claw 成功“閉環”超導材料研發

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

Meta 出擊 AI 遊戲賽道：推出“靈感生成”新應用 Pocket