歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、字節跳動推出 StoryMem 系統,解決 AI 視頻生成中的角色一致性問題
字節跳動與南洋理工大學的研究團隊聯合開發了 StoryMem 系統,旨在解決 AI 生成視頻時角色在不同場景中外觀不一致的問題。該系統通過存儲關鍵幀並在後續場景生成時參考,從而保持角色和環境的一致性。研究結果顯示,StoryMem 在跨場景一致性上提升了 28.7%,但其在複雜場景中仍存在挑戰,需要更明確的角色描述以提高生成效果。

【AiBase提要:】
🌟 StoryMem 系統能夠有效解決 AI 視頻生成中角色和環境不一致的問題。
📊 通過存儲關鍵幀,StoryMem 在跨場景一致性方面比現有模型提升了28.7%。
🛠️ 該系統在處理複雜場景時仍面臨挑戰,需對角色進行明確描述以提升生成效果。
詳情鏈接:https://kevin-thu.github.io/StoryMem/
2、月之暗面再推多模態新模型,Kimi K2 升級版擬於第一季度亮相
月之暗面計劃在2026年第一季度推出多模態模型K2.1/K2.5,該模型將基於其萬億參數開源模型Kimi K2進行升級,進一步提升多模態處理與智能體能力。公司目前擁有超過100億元人民幣的現金儲備,爲持續研發提供了充足底氣。
【AiBase提要:】
🚀 月之暗面計劃在2026年第一季度推出多模態模型K2.1/K2.5,提升多模態處理與智能體能力。
🧠 新模型基於萬億參數開源模型Kimi K2升級,支持“邊思考、邊工具協作”的Thinking模型。
💰 月之暗面擁有超過100億元人民幣的現金儲備,爲持續研發提供充足底氣。
3、AI眼鏡新王者誕生!“靈魂電腦”Pickle 1,能記住你一生所有事
Pickle1是一款融合AR顯示與高級AI的智能眼鏡,被定位爲“靈魂電腦”,通過持續捕捉用戶視覺與音頻上下文,實現無限記憶、情感理解與主動交互。

【AiBase提要:】
🧠 Pickle1通過主動學習用戶生活習慣,將日常經歷轉化爲可搜索的“記憶泡”(memory bubbles)
👓 Pickle1採用輕量化設計,支持全天佩戴,並提供雙目全綵AR顯示和高通Snapdragon AI引擎
🔒 Pickle1強調數據本地處理,使用硬件隔離加密,確保用戶隱私安全
詳情鏈接:https://www.pickle.com/
4、清華與 OpenBMB 聯合推出 UltraEval-Audio:音頻模型評測新框架開源發佈
UltraEval-Audio 是由清華大學 NLP 實驗室、OpenBMB 和麪壁智能聯合開發的音頻模型測評框架,其最新版本 v1.1.0 增加了對熱門音頻模型的一鍵復現功能,並擴展了對 TTS、ASR 和 Codec 等專業模型的支持。該框架的開源將顯著提升研究者在音頻模型開發中的效率,推動相關領域的研究進展。
【AiBase提要:】
🌟 UltraEval-Audio 是專爲音頻模型設計的測評框架,由多家機構聯合開發。
🚀 最新版本 v1.1.0 新增一鍵復現功能,支持更多專業模型的評測。
📈 開源發佈將提升研究者開發效率,推動音頻模型領域的發展。
詳情鏈接:https://github.com/OpenBMB/UltraEval-Audio
5、OpenAI押注“語音優先”未來!整合多團隊重造音頻模型,首款AI音頻硬件或明年問世
文章分析了OpenAI在語音交互領域的戰略佈局,強調其通過重構音頻系統,推動人機交互進入後屏幕時代,並探索音頻優先的硬件產品,以爭奪用戶注意力資源。
【AiBase提要:】
🎙️ OpenAI重構音頻戰略,預計2026年推出音頻優先個人設備。
🔊 新音頻模型將實現更自然的語音合成和真實對話式打斷。
📱 OpenAI計劃推出無屏智能音箱、AI眼鏡或可穿戴設備,目標是成爲用戶的“智能伴侶”。
6、無限薅 Gemini 額度神器Antigravity!一鍵切換多賬號,告別 AI 限流煩惱
Antigravity Tools是一款開源桌面應用,通過智能賬號管理和無縫切換功能,幫助用戶無限擴展Gemini、Claude等頂級模型的使用時長,成爲AI社區熱門話題。

【AiBase提要:】
🧠 實時額度監控:應用可全局監控多個AI賬號的剩餘額度與健康狀態。
🔄 自動推薦最佳賬號:系統基於實時算法,智能篩選配額充足的賬號,並支持一鍵無縫切換。
🌐 多協議兼容:支持將Web端Session轉化爲標準化API接口,解決不同廠商協議差異問題。
詳情鏈接:https://github.com/lbjlaq/Antigravity-Manager
7、元象開源XVERSE-Ent大模型!聚焦泛娛樂場景,中英雙語支持,填補行業專屬模型空白
元象科技開源了面向泛娛樂行業的專屬大模型XVERSE-Ent,該模型在社交互動、遊戲敘事和文化創作方面表現出色,並提供了多參數版本以適應不同需求。
【AiBase提要:】
🎮 專爲泛娛樂場景優化,支持社交互動、遊戲敘事和文化創作。
🧩 提供多參數版本,部署友好且開源協議商用友好。
🌐 中英雙語支持,融入大量中文網絡文學與多語言影視文本。
8、蘋果迴應“AI 功能疑似閹割”:切勿通過第三方繞開限制,警惕賬號風險
蘋果官方正式迴應了關於國行版 Apple 智能開啓灰度測試的傳聞,明確表示目前尚未上線,並提醒用戶不要通過第三方軟件強行激活 AI 功能,以免造成安全風險。
【AiBase提要:】
蘋果官方確認 Apple 智能尚未在國行版本上線,一切以官網公告爲準。
Apple 智能對硬件性能要求極高,僅 iPhone15Pro 及更新機型兼容。
蘋果警告用戶避免通過第三方軟件強行激活 AI 功能,以防賬號和資金安全風險。
