歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、字節跳動開源Lance 3B:用一個“腦子”同時搞定圖視理解與生成

字節跳動開源了其原生統一多模態大模型Lance,以3B參數實現全功能覆蓋,打破了理解模型與生成模型之間的技術壁壘。Lance通過共享上下文和能力解耦並行設計,實現了圖像、視頻的理解、生成與跨模態編輯的統一。

image.png

【AiBase提要:】

✨ Lance採用共享上下文和能力解耦並行設計,實現多模態任務統一。

🚀 3B參數量實現全功能覆蓋,打破傳統模型的技術高牆。

🔧 開源Apache2.0協議,平民級算力即可運行,降低部署成本。

2、智譜發佈GLM-5.1高速版:400 tokens/s飆出全球API新極限

智譜發佈GLM-5.1高速版API,以400tokens/s的速度刷新全球大模型API速度上限,實現旗艦級全尺寸能力與極致低延遲並存,通過系統級工程優化提升模型性能,推動AI應用的高效發展。

【AiBase提要:】

🧠 智譜GLM-5.1高速版API實現400tokens/s輸出速度,刷新全球大模型API速度上限。

🚀 實現旗艦級全尺寸能力與極致低延遲並存,打破行業慣例。

🔧 通過系統級工程優化,包括推理引擎、調度系統和基礎設施層的協同優化,提升模型性能。

3、CapCut 與 Gemini 合作推出深度集成:AI 創作工具實現智能互聯

CapCut 與 Google Gemini App 合作,用戶可在 Gemini 應用內直接調用 CapCut 的高級創意和編輯功能,進一步推動 AI 工具在內容創作領域的普及與創新。

image.png

【AiBase提要:】

🚀 CapCut 與 Google Gemini App 合作,用戶可在 Gemini 應用內直接調用 CapCut 的高級創意和編輯功能。

💡 此次合作旨在打造更無縫、高效的 AI 創作體驗,降低跨應用切換成本。

🌟 CapCut 表示未來創作方式將更加對話化、直觀化,並實現智能集成。

4、OpenAI 發佈 ChatGPT for PowerPoint:一句話生成 PPT,還能主動揪 Bug

OpenAI 推出 ChatGPT for PowerPoint 插件,使用戶能夠通過簡單的指令快速生成和優化 PPT 內容,同時具備智能分析和修改功能,極大提升了辦公效率。

image.png

【AiBase提要:】

✨ 零門檻全免費,全球用戶均可體驗 ChatGPT for PowerPoint 插件。

💡 支持從零新建 PPT、一鍵修改/潤色頁面,甚至能“覆盤”方案。

🔒 引入關鍵操作確認機制,確保每一處修改都可控。

5、WordPress 7.0 正式發佈:原生集成 AI 邁入智能建站新時代

WordPress 7.0 正式發佈,原生集成AI能力,標誌着網頁搭建邁入智能化階段。新版在內容創作、後臺界面和移動端體驗方面進行了全面升級,爲用戶帶來更高效、流暢的建站與編輯體驗。

image.png

【AiBase提要:】

🧠 原生集成AI能力,提升內容創作效率。

🎨 後臺界面現代化,優化用戶體驗。

📱 移動端自定義功能增強,提升響應式編輯能力。

6、Spotify 聯手環球音樂推出 AI 翻唱與混音:正版版權的“降維打擊”來了

Spotify與環球音樂合作推出AI翻唱和混音功能,標誌着音樂版權領域的一次重大變革。該功能基於合法授權,爲用戶提供了全新的創作方式,並通過合理的分成機制保障了藝術家的利益。這一舉措不僅提升了Spotify的市場競爭力,也對其他AI音樂平臺形成了有力的挑戰。

【AiBase提要:】

🎧 Spotify與環球音樂達成AI翻唱和混音協議,爲粉絲提供合法創作工具。

⚖️ 強調“知情同意、致敬署名和合理報酬”的黃金三原則,區別於其他AI平臺的侵權模式。

📈 Spotify股價因AI戰略暴漲13%,展現其在音樂版權領域的強大影響力。

7、拒絕“人機單聊”!UniClaw2026 公測:AI 正在邁入“多人社交模式”

北京本源萬象人工智能科技有限公司推出的全新AI原生即時通訊產品UniClaw,其突破了傳統單聊對話框模式,將AI從單人效率工具升級爲羣體協作的社交Agent,開啓了AI的多人協作模式。文章還詳細描述了UniClaw的三大核心角色以及開放的Agent應用社區。

【AiBase提要:】

✨ UniClaw作爲AI原生即時通訊產品,打破了傳統單聊對話框模式,開啓AI多人協作模式。

🧠 AI智能體(Agent)在羣組中承擔信息中樞、溝通潤滑劑和主動協調人的角色,提升協作效率。

🚀 開放的Agent應用社區降低了使用門檻,用戶可一鍵引入特定功能的Agent,實現即插即用。

8、拒絕彩排,真刀真槍上舞臺!美團LongCat-Video-Avatar1.5開源:全面擊敗主流閉源模型

美團龍貓大模型團隊正式開源商用級數字人視頻生成模型 LongCat-Video-Avatar1.5,該版本在脣形同步、物理合理性、長視頻穩定性等方面實現全面躍升,並通過多項技術升級顯著提升了模型的商業應用價值和用戶體驗。

image.png

【AiBase提要:】

🧠 模型將音頻特徵提取編碼器從 Wav2Vec2 升級爲 Whisper-large,提升音素變化與發音節奏的捕捉能力。

🔄 引入 GRPO 技術,優化手部與連續性對齊,解決手部畸變和動作不連貫問題。

🚀 採用 DMD 技術,推理效率提升 15 倍,生成一段 10 秒視頻僅需約 1 分鐘。

詳情鏈接:https://github.com/meituan-longcat/LongCat-Video