AI日報：MiniMax Music 2.5 發佈；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、MiniMax Music 2.5 正式發佈：攻克 AI 音樂“控”與“真”兩大難題

MiniMax Music 2.5 的發佈標誌着 AI 音樂創作在可控性和真實度上取得了重大突破。通過段落級強控制和物理級高保真技術，該版本爲創作者提供了更精準的音樂製作工具，同時針對華語市場進行了深度優化，提升了中文音樂的表現力和流暢性。

【AiBase提要:】
🎵 全段落掌控 :支持14種音樂結構標籤，讓 AI 創作從“隨機生成”轉向“精準指揮”。
🎤 真實人聲質感 :具備細膩的轉音與顫音表現，支持男女對唱中的自然協同感與和聲層次。
🎹 專業級混音 :內置百餘種樂器音色，具備自動適配風格的混音能力，實現錄音室級音頻交付。

2、螞蟻靈波開源世界模型LingBot-World，高保真高動態，毫秒級實時交互

螞蟻靈波科技開源了世界模型LingBot-World，該模型在視頻質量、動態程度、長時一致性及交互能力等方面表現優異，可爲具身智能、自動駕駛和遊戲開發提供高保真的數字演練場。

【AiBase提要:】
🌍 LingBot-World具備高保真與高動態特性，支持10分鐘連續穩定生成。
🕹️ 實現16FPS生成吞吐與1秒內端到端交互延遲，支持實時控制。
🔄 支持Zero-shot泛化能力，僅需輸入真實照片或遊戲截圖即可生成可交互視頻流。

3、谷歌 Gemini 3.5 泄露：代號 Snow Bunny，單次提示可生成三千行代碼

谷歌 Gemini 3.5 的泄露信息揭示了其在編程領域的重大突破，包括單次提示生成3000行代碼的能力以及引入深度推理架構。此外，還提到了多個專項模型以應對不同使用場景，顯示出該模型的強大功能和潛在影響力。

【AiBase提要:】
🐰 Snow Bunny 計劃 : 內部模型 Snow Bunny 具備極強的應用構建能力，單次可產出3000行代碼。
🧠 深度推理架構 : 引入“系統2”思維和 Deep Think 切換開關，顯著提升複雜邏輯問題的解決率。
🚀 多模型協同 : 泄露信息提及 Fierce Falcon（速度與邏輯）與 Ghost Falcon(多模態創作) 兩款專項模型。

4、Kimi K2.5 Agent 助力高效辦公：Excel、Word、PDF 全面升級

Kimi K2.5 的發佈標誌着月之暗面旗下的 Kimi Agent 在辦公能力上實現了重大突破，能夠深入處理 Excel、Word、PDF 和 PPT 的核心功能，提供專業級的工作成果。此次升級顯著提升了效率，使原本需要數小時甚至數天的任務在幾分鐘內完成，同時解鎖了多項高階辦公場景，如數據建模、智能審閱和視覺敘事等，讓用戶無需複雜操作即可高效完成工作。

【AiBase提要:】
📊 模型升級：依託最新 Kimi K2.5，Agent 辦公能力從“閱讀總結”進化爲“核心創作與排版”。
💼 精通 Office：全面覆蓋 Excel 數據建模、Word 審閱批註、PPT 邏輯生成及 PDF 視覺設計。
⚡ 效率平權：將數天的機械勞動縮減至分鐘級，讓非專業人士也能交付專業級辦公文檔。

5、工業AI新突破：蘑菇物聯“靈知”垂直大模型通過國家網信辦備案

蘑菇物聯的‘靈知AI’垂直大模型通過國家網信辦生成式人工智能服務備案，標誌着其在工業公輔能源領域的領先地位。該模型聚焦四大核心能力場景，包括智能問答、精準預測、實時診斷和優化控制，展現了強大的專業性和實用性。

【AiBase提要:】
🧠 智能問答:爲複雜工業場景提供即時的專業知識解答。
📈 精準預測:通過歷史數據分析，預判設備運行趨勢與能源消耗。
🔧 實時診斷:快速定位工業設備故障，提升維護效率。

6、崑崙萬維 SkyReels-V3開源，實現多模態視頻生成技術突破

崑崙萬維SkyReels-V3開源，標誌着視頻生成技術進入高保真、多模態的新階段，通過單一建模架構實現了參考圖像轉視頻、視頻延長以及音頻驅動虛擬形象三大核心能力的深度集成。

【AiBase提要:】
🎥 參考圖像轉視頻（I2V）功能支持1至4張參考圖輸入，精準保留主體身份特徵與空間構圖。
🎞 視頻延長功能引入“鏡頭切換延長模式”，實現邏輯的“敘事擴展”。
🎙 音頻驅動虛擬形象模塊實現極高口型同步率，支持分鐘級長視頻生成及多角色交互。
詳情鏈接:https://github.com/SkyworkAI/SkyReels-V3

7、崑崙天工發佈音樂大模型 Mureka V8：實現從“可生成”到“可發佈”的躍遷

崑崙天工音樂大模型 Mureka V8 的發佈標誌着 AI 音樂技術的重大進步。該模型基於 MusiCoT 技術體系，實現了更接近人類創作邏輯的音樂生成，提升了音樂性、編曲完成度、人聲表達及音質質感，使 AI 音樂從“可生成”邁向“可發佈”。

【AiBase提要:】
🎵 技術突破：依託 MusiCoT 技術體系，實現模擬人類創作邏輯的深度建模。
🎹 成品級質感：在旋律、人聲和編曲等維度全面升級，使作品達到“可發佈”級別。
🛠️ 創作協同：支持用戶通過自然語言和參考素材進行反覆調整迭代，而非隨機生成。
詳情鏈接:https://www.mureka.ai/ https://www.mureka.cn/

8、三星官宣：下一代 AR 眼鏡將於 2026 年發佈，主打多模態 AI

三星正式確認其下一代 AR 眼鏡將於 2026 年發佈，主打多模態 AI 體驗，核心賣點包括智能輔助、輕便設計以及先進的硬件配置。

【AiBase提要:】
🧠 智能輔助：通過語音、視覺及多種交互輸入，提供沉浸式智能輔助服務。
👓 輕便設計：外觀接近普通眼鏡，確保日常佩戴的舒適感。
⚙️ 硬件規格：搭載高通 AR1 芯片組，配備 1200 萬像素自動對焦攝像頭。

AI日報：MiniMax Music 2.5 發佈；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

相關推薦

讓機器人學會番茄炒蛋的“幕後推手”：Genesis AI 開源全棧訓練場

AI 智能體 Elements Claw 成功“閉環”超導材料研發

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具