AI日報：字節開源統一多模態大模型Lance 3B;智譜發佈GLM-5.1高速版;CapCut與Gemini合作推出深度集成

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、字節跳動開源Lance 3B：用一個“腦子”同時搞定圖視理解與生成

字節跳動開源了其原生統一多模態大模型Lance，以3B參數實現全功能覆蓋，打破了理解模型與生成模型之間的技術壁壘。Lance通過共享上下文和能力解耦並行設計，實現了圖像、視頻的理解、生成與跨模態編輯的統一。

【AiBase提要:】
✨ Lance採用共享上下文和能力解耦並行設計，實現多模態任務統一。
🚀 3B參數量實現全功能覆蓋，打破傳統模型的技術高牆。
🔧 開源Apache2.0協議，平民級算力即可運行，降低部署成本。

2、智譜發佈GLM-5.1高速版：400 tokens/s飆出全球API新極限

智譜發佈GLM-5.1高速版API，以400tokens/s的速度刷新全球大模型API速度上限，實現旗艦級全尺寸能力與極致低延遲並存，通過系統級工程優化提升模型性能，推動AI應用的高效發展。

【AiBase提要:】
🧠 智譜GLM-5.1高速版API實現400tokens/s輸出速度，刷新全球大模型API速度上限。
🚀 實現旗艦級全尺寸能力與極致低延遲並存，打破行業慣例。
🔧 通過系統級工程優化，包括推理引擎、調度系統和基礎設施層的協同優化，提升模型性能。

3、CapCut 與 Gemini 合作推出深度集成:AI 創作工具實現智能互聯

CapCut 與 Google Gemini App 合作，用戶可在 Gemini 應用內直接調用 CapCut 的高級創意和編輯功能，進一步推動 AI 工具在內容創作領域的普及與創新。

【AiBase提要:】
🚀 CapCut 與 Google Gemini App 合作，用戶可在 Gemini 應用內直接調用 CapCut 的高級創意和編輯功能。
💡 此次合作旨在打造更無縫、高效的 AI 創作體驗，降低跨應用切換成本。
🌟 CapCut 表示未來創作方式將更加對話化、直觀化，並實現智能集成。

4、OpenAI 發佈 ChatGPT for PowerPoint：一句話生成 PPT，還能主動揪 Bug

OpenAI 推出 ChatGPT for PowerPoint 插件，使用戶能夠通過簡單的指令快速生成和優化 PPT 內容，同時具備智能分析和修改功能，極大提升了辦公效率。

【AiBase提要:】
✨ 零門檻全免費，全球用戶均可體驗 ChatGPT for PowerPoint 插件。
💡 支持從零新建 PPT、一鍵修改/潤色頁面，甚至能“覆盤”方案。
🔒 引入關鍵操作確認機制，確保每一處修改都可控。

5、WordPress 7.0 正式發佈：原生集成 AI 邁入智能建站新時代

WordPress 7.0 正式發佈，原生集成AI能力，標誌着網頁搭建邁入智能化階段。新版在內容創作、後臺界面和移動端體驗方面進行了全面升級，爲用戶帶來更高效、流暢的建站與編輯體驗。

【AiBase提要:】
🧠 原生集成AI能力，提升內容創作效率。
🎨 後臺界面現代化，優化用戶體驗。
📱 移動端自定義功能增強，提升響應式編輯能力。

6、Spotify 聯手環球音樂推出 AI 翻唱與混音：正版版權的“降維打擊”來了

Spotify與環球音樂合作推出AI翻唱和混音功能，標誌着音樂版權領域的一次重大變革。該功能基於合法授權，爲用戶提供了全新的創作方式，並通過合理的分成機制保障了藝術家的利益。這一舉措不僅提升了Spotify的市場競爭力，也對其他AI音樂平臺形成了有力的挑戰。

【AiBase提要:】
🎧 Spotify與環球音樂達成AI翻唱和混音協議，爲粉絲提供合法創作工具。
⚖️ 強調“知情同意、致敬署名和合理報酬”的黃金三原則，區別於其他AI平臺的侵權模式。
📈 Spotify股價因AI戰略暴漲13%，展現其在音樂版權領域的強大影響力。

7、拒絕“人機單聊”！UniClaw2026 公測：AI 正在邁入“多人社交模式”

北京本源萬象人工智能科技有限公司推出的全新AI原生即時通訊產品UniClaw，其突破了傳統單聊對話框模式，將AI從單人效率工具升級爲羣體協作的社交Agent，開啓了AI的多人協作模式。文章還詳細描述了UniClaw的三大核心角色以及開放的Agent應用社區。

【AiBase提要:】
✨ UniClaw作爲AI原生即時通訊產品，打破了傳統單聊對話框模式，開啓AI多人協作模式。
🧠 AI智能體（Agent）在羣組中承擔信息中樞、溝通潤滑劑和主動協調人的角色，提升協作效率。
🚀 開放的Agent應用社區降低了使用門檻，用戶可一鍵引入特定功能的Agent，實現即插即用。

8、拒絕彩排，真刀真槍上舞臺!美團LongCat-Video-Avatar1.5開源:全面擊敗主流閉源模型

美團龍貓大模型團隊正式開源商用級數字人視頻生成模型 LongCat-Video-Avatar1.5，該版本在脣形同步、物理合理性、長視頻穩定性等方面實現全面躍升，並通過多項技術升級顯著提升了模型的商業應用價值和用戶體驗。

【AiBase提要:】
🧠 模型將音頻特徵提取編碼器從 Wav2Vec2 升級爲 Whisper-large，提升音素變化與發音節奏的捕捉能力。
🔄 引入 GRPO 技術，優化手部與連續性對齊，解決手部畸變和動作不連貫問題。
🚀 採用 DMD 技術，推理效率提升 15 倍，生成一段 10 秒視頻僅需約 1 分鐘。
詳情鏈接:https://github.com/meituan-longcat/LongCat-Video

AI日報：字節開源統一多模態大模型Lance 3B;智譜發佈GLM-5.1高速版;CapCut與Gemini合作推出深度集成

相關推薦

OpenAI炮轟AI評測"標杆"： 731 道題近三成有缺陷， 8 個月通過率從23%飆到80%已失靈

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案

全球首部AI女演員主演電影開機：沒有身體沒有童年，卻能調取全人類記憶

AI編碼圈再傳重磅：瑞典新星Lovable估值或將翻倍至 132 億美元

AI日報：字節開源統一多模態大模型Lance 3B;智譜發佈GLM-5.1高速版;CapCut與Gemini合作推出深度集成

相關推薦

OpenAI炮轟AI評測"標杆"： 731 道題近三成有缺陷， 8 個月通過率從23%飆到80%已失靈

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

​一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案

全球首部AI女演員主演電影開機：沒有身體沒有童年，卻能調取全人類記憶

AI編碼圈再傳重磅：瑞典新星Lovable估值或將翻倍至 132 億美元

一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案