AI日報：AI內容新規正式生效；美團推出開源大模型LongCat；階躍發佈語音大模型Step-Audio 2 mini

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、階躍發佈端到端語音大模型Step-Audio 2 mini

階躍星辰發佈了最強開源端到端語音大模型Step-Audio2mini，其在多個國際基準測試中取得SOTA成績，表現出卓越的音頻理解、語音識別、跨語種翻譯和對話能力。該模型採用創新架構設計，突破傳統ASR+LLM+TTS三級結構，實現原始音頻輸入到語音響應輸出的直接轉換，並引入鏈式思維推理與強化學習聯合優化，提升對副語言信息的理解和自然迴應能力。

【AiBase提要:】
🔥 Step-Audio2mini在多個國際基準測試中取得SOTA成績，性能超越Qwen-Omni、Kimi-Audio等開源模型。
🧠 模型採用真端到端多模態架構，突破傳統ASR+LLM+TTS三級結構，實現更簡潔、低時延的音頻處理。
💡 引入鏈式思維推理與強化學習聯合優化，提升對情緒、語調、音樂等副語言信息的理解和自然迴應能力。
詳情鏈接:https://github.com/stepfun-ai/Step-Audio2

2、9月1日AI內容新規正式生效！不標識就違法

《人工智能生成合成內容標識辦法》於9月1日起強制實施，標誌着中國AI內容治理進入制度化、規範化的新階段。新規要求所有AI生成內容必須進行顯式和隱式標識，以提升信息透明度並防止虛假信息傳播。

【AiBase提要:】
✅ 顯式標識要求AI生成內容在文本、圖片、視頻和音頻中明確標註，打破AI內容的隱身術。
🔍 隱式標識通過數字指紋技術嵌入元數據，實現內容溯源和監管能力提升。
⚖️ 違規後果嚴重，包括限流、整改、下架及法律風險，推動AI產業規範發展。

3、美團推出開源大模型LongCat:旨在賦能開發者，加速AI應用落地

美團推出的開源大模型LongCat具有強大的技術實力，通過創新的混合專家架構實現了高效的計算性能，並在多個基準測試中表現出色，爲開發者提供了強大的工具。

【AiBase提要:】
🧠 LongCat-Flash擁有560億參數，採用混合專家（MoE）架構，動態激活部分參數以優化計算效率。
🚀 支持超過100個標記每秒的推理處理能力，具備低延遲和高擴展性。
📊 在MMLU、數學推理等任務中表現優異，展示了其在實際應用中的潛力。
詳情鏈接:https://longcat.chat/

4、上海AI實驗室發佈多模態大模型書生·萬象 InternVL3.5

上海AI實驗室發佈了多模態大模型InternVL3.5，通過創新的級聯式強化學習、動態視覺分辨率路由與解耦部署架構，實現了推理能力、部署效率與通用能力的全面升級。該模型在多個基準測試中表現優異，超越了GPT-5和Claude-3.7-Sonnet等主流模型。

【AiBase提要:】
✨ InternVL3.5採用級聯式強化學習框架，顯著提升了推理性能。
🖼️ 模型支持多種視覺分辨率，並優化了響應速度。
🚀 提供多種參數規模模型，滿足不同資源需求場景。
詳情鏈接:https://github.com/OpenGVLab/InternVL

5、騰訊ARC開源音頻模型 AudioStory：用大語言模型生成長音頻

騰訊ARC團隊推出的AudioStory模型，結合了大語言模型和音頻生成技術，能夠生成結構化且具有時間一致性的長篇敘事音頻。該模型在指令跟隨能力和音頻質量方面表現出色，適用於視頻配音和長音頻生成等多種場景。

【AiBase提要:】
🎧 AudioStory 是一款基於大語言模型的長篇敘事音頻生成模型，能夠處理多種音頻任務。
📊 模型具備強大的指令跟隨能力，可生成連貫的音頻敘事，提升用戶體驗。
🛠️ 團隊已發佈推理代碼，並展示多個應用案例，展現其在視頻配音和長音頻生成上的優勢。
詳情鏈接:https://github.com/TencentARC/AudioStory

6、OpenAI震撼發佈GPT-realtime！語音AI革命來了，人機對話真假難辨

OpenAI推出的GPT-realtime語音模型在自然流暢度和情感表達方面實現了重大突破，能夠精準模擬人類語調、情感波動和語速變化。該模型不僅具備多模態處理能力，還能實時調整語音風格以適應不同場景需求，爲AI語音交互帶來了革命性的變化。

【AiBase提要:】
🚀 GPT-realtime實現了前所未有的自然語音交互體驗，精準還原人類語音細節。
🧠 模型具備多模態處理能力，結合圖像與語音信息進行綜合分析和響應。
💡 支持多種語音風格切換，滿足不同場景下的個性化語音交互需求。

7、Meta 與 UCSD 推出 DeepConf：AI 推理準確率達 99.9%，計算成本降低 85%

Meta與加州大學聖地亞哥分校（UCSD）合作推出的DeepConf技術，在高難度推理任務中實現了99.9%的準確率，並將計算資源消耗降低了84.7%。該技術通過引入“置信度”機制，使AI能夠動態調整解題策略，從而提高推理效率和準確性。

【AiBase提要:】
🔍 DeepConf 技術在高難度推理任務中實現了99.9% 的準確率。
💡 計算資源消耗減少了84.7%，大幅降低了運算成本。
🚀 通過 “置信度” 機制，AI 能夠動態調整解題策略，提升推理效率。
詳情鏈接:https://arxiv.org/abs/2508.15260

8、馬斯克承認xAI代碼庫遭竊，前員工轉投 OpenAI！

馬斯克承認xAI代碼庫遭竊，前員工Xuechen Li被指控竊取商業機密並轉投OpenAI，事件引發科技界廣泛關注。

【AiBase提要:】
💻 前員工Xuechen Li被指控竊取xAI的商業機密並轉投OpenAI。
🔒 xAI要求法院禁止Li在OpenAI工作，並歸還被盜數據。
🚀 Li離職前套現近700萬美元，可能爲OpenAI節省數十億美元研發費用。

9、阿里巴巴 Qwen 團隊發佈下一代 GUI 自動化框架 Mobile-Agent-v3 和 GUI-Owl

阿里巴巴 Qwen 團隊推出了兩款革命性的產品 ——Mobile-Agent-v3 和 GUI-Owl，旨在解決圖形用戶界面（GUI）自動化中的挑戰。這些工具通過多模態模型和多代理協作，提升了任務理解和執行的能力，展現出強大的跨平臺任務完成能力，標誌着阿里巴巴在通用 GUI 自動化領域的重大進展。

【AiBase提要:】
🧠 GUI-Owl 是阿里巴巴推出的多模態代理模型，集成感知、推理和執行能力，適應複雜 GUI 環境。
🤖 Mobile-Agent-v3 框架實現多代理協作，通過動態更新計劃提升任務執行效率。
📊 這兩款產品在 GUI 自動化基準測試中表現出色，標誌着阿里巴巴在自動化領域的重要突破。
詳情鏈接:https://arxiv.org/abs/2508.15144

10、微軟推出Copilot Labs，首個實驗性工具“Copilot音頻表達”上線

微軟推出了全新的實驗性AI中心Copilot Labs，旨在邀請用戶參與AI的創新與發展。其首個工具是“Copilot音頻表達”，能夠將書面文本轉化爲自然流暢的語音旁白，並支持情感和故事模式，讓用戶擁有高度控制權。

【AiBase提要:】
🌟 Copilot Labs是一個邀請用戶參與AI創新的平臺，標誌着微軟在AI領域的進一步探索。
🔊 “Copilot音頻表達”是首個實驗性工具，可將文本轉換爲自然語音，並支持情感和故事模式。
🌐 該工具在全球範圍內免費開放，但部分功能需要登錄Microsoft賬戶並擁有Copilot Pro訂閱。
詳情鏈接:https://copilot.microsoft.com/labs/experiments/audio-expression

11、小紅書自動化神器xiaohongshu-mcp上線！AI助力內容創作，解放你的雙手！

xiaohongshu-mcp這一基於MCP協議的開源工具，能夠實現小紅書平臺的自動化登錄、內容發佈和數據獲取功能。該工具通過與AI客戶端集成，簡化了操作流程，並具備良好的擴展性，適合內容創作者和開發者使用。

【AiBase提要:】
🔐 智能登錄，持久化體驗：首次掃碼登錄後，後續操作無需重複登錄。
🖼️ 圖文發佈領跑，未來功能可期：目前支持圖文內容自動化發佈，未來計劃擴展視頻發佈和數據分析功能。
🛠️ 開發者友好，生態開放：基於Go語言開發，代碼結構清晰，易於二次開發，支持GitHub克隆部署。
詳情鏈接:https://github.com/xpzouying/xiaohongshu-mcp

AI日報：AI內容新規正式生效；美團推出開源大模型LongCat；階躍發佈語音大模型Step-Audio 2 mini

相關推薦

網信部門依法查處“剪映”及“即夢AI”等平臺違規標識行爲

美圖RoboNeo接入阿里HappyHorse模型，視頻創作能力實現全面迭代

不用額外掏錢！Anthropic 緊急闢謠：Claude Pro 用戶仍可免費使用 Opus 模型

阿里巴巴發佈創新癌症AI模型助力腸癌篩查

泰勒·斯威夫特提交聲音與肖像商標申請，以法律利器防禦 AI 侵權

AI日報：AI內容新規正式生效；美團推出開源大模型LongCat；階躍發佈語音大模型Step-Audio 2 mini

相關推薦

網信部門依法查處“剪映”及“即夢AI”等平臺違規標識行爲

美圖RoboNeo接入阿里HappyHorse模型，視頻創作能力實現全面迭代

不用額外掏錢！Anthropic 緊急闢謠：Claude Pro 用戶仍可免費使用 Opus 模型

​阿里巴巴發佈創新癌症AI模型 助力腸癌篩查

泰勒·斯威夫特提交聲音與肖像商標申請，以法律利器防禦 AI 侵權

阿里巴巴發佈創新癌症AI模型助力腸癌篩查