歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、延遲低於250毫秒!MiniMax Speech 2.6發佈,Fluent LoRA一鍵復刻任意音色,語音合成邁入實時交互時代

MiniMax Speech 2.6發佈,以低延遲和音色復刻技術推動語音合成進入實時交互時代。

image.png

【AiBase提要:】

🎙️ 通過Fluent LoRA技術,僅需30秒音頻即可克隆音色。

⏱️ 實現端到端延遲低於250毫秒,接近人類對話節奏。

🌐 支持教育、客服、智能硬件等多場景應用。

2、螞蟻數科Agentar打造“金融AI大腦”,入選國際標準卓越案例

文章介紹了螞蟻數科與寧波銀行合作打造的Agentar知識工程KBase案例,成功入選國際標準金融應用卓越案例。該方案通過知識工程技術解決金融機構的知識孤島問題,構建智能化決策系統,顯著提升服務效率和準確率,並具備強可解釋性,爲金融行業智能化升級樹立了新標杆。

【AiBase提要:】

🧠 Agentar知識工程平臺實現多源異構數據的全生命週期管理

💡 系統通過“規劃-檢索-推理”機制提升知識質量與AI邏輯推理能力

🔒 強可解釋性保障生成式AI在金融領域的安全合規應用

3、智源發佈Emu3.5大模型:以“下一狀態預測”重構多模態智能,具身操作能力驚豔業界

智源發佈Emu3.5大模型,通過“下一狀態預測”重構多模態智能,具備強大的具身操作能力,標誌着AI從感知理解邁向智能操作的關鍵一步。

【AiBase提要:】

🧠 Emu3.5引入自迴歸式“下一狀態預測”(NSP)框架,實現多模態序列建模的突破。

🖼️ 支持文圖協同生成、智能圖像編輯和時空動態推理,提升跨模態操作能力。

🔄 打破信息孤島,統一編碼文本、視覺和動作等模態,實現跨模態自由切換與協同推理。

4、Cursor 2.0震撼發佈!自研模型Composer快4倍,8個AI Agent並行編碼,開發者效率迎來“核爆級”升級

Cursor 2.0的發佈標誌着其從智能補全插件向多智能體協同開發平臺的範式躍遷,通過自研模型Composer和多Agent界面顯著提升了開發效率和質量。

image.png

【AiBase提要:】

🧠 Composer模型專爲代理式編碼設計,採用強化學習和混合專家架構,響應速度提升4倍。

ParallelGroup 多個AI Agent並行工作,支持獨立任務處理,提高複雜項目的開發效率。

🔄 全流程自動化功能整合代碼審查、測試與執行,減少上下文切換,提升開發者專注度。

5、xAI升級Grok Imagine iOS版:新增視頻生成與提示重混

xAI宣佈其Grok Imagine工具iOS版將推出視頻生成功能,支持用戶通過文本或圖像提示生成高清動態視頻,並可從內容提要中直接重混提示。該功能基於Aurora/Grok核心模型優化,提升操作流暢性,適用於短片、廣告及創意內容。

image.png

【AiBase提要:】

🎥 新增視頻生成功能,支持文本或圖像提示生成高清動態視頻。

🔄 提示重混機制降低創作門檻,允許快速迭代創作。

📱 iOS優先更新,Android及網頁版隨後跟進,強化移動AI創作能力。

6、OpenAI 推出新型安全模型gpt-oss-safeguard,助力 AI 領域靈活應對風險

OpenAI 推出的 gpt-oss-safeguard 系列模型在 AI 安全領域提供了更高的靈活性和可定製性,能夠根據開發者設定的安全政策進行分類並提供推理理由。然而,這些模型在處理速度和資源消耗方面存在一定的侷限性,因此在某些場景下可能不如傳統分類器表現優異。

【AiBase提要:】

🛡️ OpenAI 推出了 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 兩款新型安全模型,允許靈活自定義安全政策。

⚙️ 新模型能夠根據輸入的安全政策對用戶消息和對話進行分類,並提供推理理由。

📊 儘管新模型具有優勢,但在某些情況下,傳統分類器可能更有效,且新模型資源消耗較大。

詳情鏈接:https://huggingface.co/collections/openai/gpt-oss-safeguard

7、TikTok推AI剪輯新工具“Smart Split”,助力創作者輕鬆剪輯與內容策劃

TikTok 在美國創作者峯會上推出了三項全新功能,包括 AI 驅動的視頻剪輯工具 “Smart Split”、內容規劃工具 “AI Outline” 以及更新的創作者分成政策,旨在提升創作者的工作效率和變現能力。

image.png

【AiBase提要:】

🎥 TikTok 推出 AI 剪輯工具 “Smart Split”,自動生成短視頻和字幕。

📝 新的內容規劃工具 “AI Outline” 幫助創作者輕鬆生成視頻大綱。

💰 升級的分成政策允許優秀創作者獲得高達90% 的收益分成。

8、微軟推出 Agent Lightning:全新 AI 框架助力強化學習訓練大規模語言模型

微軟推出的 Agent Lightning 是一個開源框架,旨在通過強化學習優化多代理系統,無需重構現有架構即可提升大規模語言模型的性能。

image.png

【AiBase提要:】

🧠 Agent Lightning 將代理建模爲部分可觀測的馬爾可夫決策過程,提升策略性能。

🚀 該框架支持在不重構現有系統的情況下優化多代理系統,實現訓練代理解耦。

📈 實驗表明,在文本轉 SQL、檢索增強生成和數學問答任務中均取得顯著性能提升。

詳情鏈接:https://arxiv.org/abs/2508.03680v1