歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、字節跳動推出 StoryMem 系統,解決 AI 視頻生成中的角色一致性問題

字節跳動與南洋理工大學的研究團隊聯合開發了 StoryMem 系統,旨在解決 AI 生成視頻時角色在不同場景中外觀不一致的問題。該系統通過存儲關鍵幀並在後續場景生成時參考,從而保持角色和環境的一致性。研究結果顯示,StoryMem 在跨場景一致性上提升了 28.7%,但其在複雜場景中仍存在挑戰,需要更明確的角色描述以提高生成效果。

image.png

【AiBase提要:】

🌟 StoryMem 系統能夠有效解決 AI 視頻生成中角色和環境不一致的問題。

📊 通過存儲關鍵幀,StoryMem 在跨場景一致性方面比現有模型提升了28.7%。

🛠️ 該系統在處理複雜場景時仍面臨挑戰,需對角色進行明確描述以提升生成效果。

詳情鏈接:https://kevin-thu.github.io/StoryMem/

2、月之暗面再推多模態新模型,Kimi K2 升級版擬於第一季度亮相

月之暗面計劃在2026年第一季度推出多模態模型K2.1/K2.5,該模型將基於其萬億參數開源模型Kimi K2進行升級,進一步提升多模態處理與智能體能力。公司目前擁有超過100億元人民幣的現金儲備,爲持續研發提供了充足底氣。

【AiBase提要:】

🚀 月之暗面計劃在2026年第一季度推出多模態模型K2.1/K2.5,提升多模態處理與智能體能力。

🧠 新模型基於萬億參數開源模型Kimi K2升級,支持“邊思考、邊工具協作”的Thinking模型。

💰 月之暗面擁有超過100億元人民幣的現金儲備,爲持續研發提供充足底氣。

3、AI眼鏡新王者誕生!“靈魂電腦”Pickle 1,能記住你一生所有事

Pickle1是一款融合AR顯示與高級AI的智能眼鏡,被定位爲“靈魂電腦”,通過持續捕捉用戶視覺與音頻上下文,實現無限記憶、情感理解與主動交互。

image.png

【AiBase提要:】

🧠 Pickle1通過主動學習用戶生活習慣,將日常經歷轉化爲可搜索的“記憶泡”(memory bubbles)

👓 Pickle1採用輕量化設計,支持全天佩戴,並提供雙目全綵AR顯示和高通Snapdragon AI引擎

🔒 Pickle1強調數據本地處理,使用硬件隔離加密,確保用戶隱私安全

詳情鏈接:https://www.pickle.com/

4、清華與 OpenBMB 聯合推出 UltraEval-Audio:音頻模型評測新框架開源發佈

UltraEval-Audio 是由清華大學 NLP 實驗室、OpenBMB 和麪壁智能聯合開發的音頻模型測評框架,其最新版本 v1.1.0 增加了對熱門音頻模型的一鍵復現功能,並擴展了對 TTS、ASR 和 Codec 等專業模型的支持。該框架的開源將顯著提升研究者在音頻模型開發中的效率,推動相關領域的研究進展。

【AiBase提要:】

🌟 UltraEval-Audio 是專爲音頻模型設計的測評框架,由多家機構聯合開發。

🚀 最新版本 v1.1.0 新增一鍵復現功能,支持更多專業模型的評測。

📈 開源發佈將提升研究者開發效率,推動音頻模型領域的發展。

詳情鏈接:https://github.com/OpenBMB/UltraEval-Audio

5、OpenAI押注“語音優先”未來!整合多團隊重造音頻模型,首款AI音頻硬件或明年問世

文章分析了OpenAI在語音交互領域的戰略佈局,強調其通過重構音頻系統,推動人機交互進入後屏幕時代,並探索音頻優先的硬件產品,以爭奪用戶注意力資源。

【AiBase提要:】

🎙️ OpenAI重構音頻戰略,預計2026年推出音頻優先個人設備。

🔊 新音頻模型將實現更自然的語音合成和真實對話式打斷。

📱 OpenAI計劃推出無屏智能音箱、AI眼鏡或可穿戴設備,目標是成爲用戶的“智能伴侶”。

6、無限薅 Gemini 額度神器Antigravity!一鍵切換多賬號,告別 AI 限流煩惱

Antigravity Tools是一款開源桌面應用,通過智能賬號管理和無縫切換功能,幫助用戶無限擴展Gemini、Claude等頂級模型的使用時長,成爲AI社區熱門話題。

image.png

【AiBase提要:】

🧠 實時額度監控:應用可全局監控多個AI賬號的剩餘額度與健康狀態。

🔄 自動推薦最佳賬號:系統基於實時算法,智能篩選配額充足的賬號,並支持一鍵無縫切換。

🌐 多協議兼容:支持將Web端Session轉化爲標準化API接口,解決不同廠商協議差異問題。

詳情鏈接:https://github.com/lbjlaq/Antigravity-Manager

7、元象開源XVERSE-Ent大模型!聚焦泛娛樂場景,中英雙語支持,填補行業專屬模型空白

元象科技開源了面向泛娛樂行業的專屬大模型XVERSE-Ent,該模型在社交互動、遊戲敘事和文化創作方面表現出色,並提供了多參數版本以適應不同需求。

【AiBase提要:】

🎮 專爲泛娛樂場景優化,支持社交互動、遊戲敘事和文化創作。

🧩 提供多參數版本,部署友好且開源協議商用友好。

🌐 中英雙語支持,融入大量中文網絡文學與多語言影視文本。

8、蘋果迴應“AI 功能疑似閹割”:切勿通過第三方繞開限制,警惕賬號風險

蘋果官方正式迴應了關於國行版 Apple 智能開啓灰度測試的傳聞,明確表示目前尚未上線,並提醒用戶不要通過第三方軟件強行激活 AI 功能,以免造成安全風險。

【AiBase提要:】

蘋果官方確認 Apple 智能尚未在國行版本上線,一切以官網公告爲準。

Apple 智能對硬件性能要求極高,僅 iPhone15Pro 及更新機型兼容。

蘋果警告用戶避免通過第三方軟件強行激活 AI 功能,以防賬號和資金安全風險。