歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、阿里巴巴 ATH 推出開放世界模型 Happy Oyster,開啓實時交互體驗申請

阿里巴巴 ATH 團隊推出了全新的開放世界模型 Happy Oyster,該模型具備實時交互和創建能力,進一步拓展了其在生成式 AI 領域的技術佈局。同時,其旗下的 HappyHorse-1.0 模型在 Video Edit 方向排行榜中取得全球第一的成績,展現了強大的多模態視覺處理能力。Happy Oyster 的發佈反映了行業向動態可交互環境發展的趨勢,併爲遊戲開發、虛擬仿真及創意設計提供了更高維度的生產力工具。

QQ20260416-135915.jpg

【AiBase提要:】

🧠 阿里巴巴 ATH 團隊推出全新開放世界模型 Happy Oyster,支持實時交互與創建能力。

📊 在最新 Video Edit 方向排行榜中,HappyHorse-1.0 模型以 1299 分位列全球榜首,展現深厚技術實力。

🚀 Happy Oyster 的發佈標誌着生成式 AI 技術從靜態內容生成向動態可交互環境的進化趨勢。

詳情鏈接:https://www.happyoyster.cn/

2、Anthropic即將發佈Claude Opus 4.7及全新AI設計工具

Anthropic 即將發佈 Claude Opus 4.7 和全新 AI 設計工具,引發市場關注。

image.png

【AiBase提要:】

🧠 Claude Opus 4.7 是對 4.6 的增量升級,帶來編碼能力增強和上下文窗口擴展。

🎨 Anthropic 正準備發佈一款 AI 驅動的設計工具,直接與 Gamma、Google Stitch 等競爭。

💰 Anthropic 的估值已達到 8000 億美元,年化營收從 90 億美元攀升至 300 億美元。

3、騰訊開源混元3D 世界模型2.0,支持一鍵生成可編輯3D 空間資產

騰訊混元團隊正式發佈並開源了“混元3D世界模型2.0”,該版本在多模態世界模型上實現了重大升級,能夠生成可交互、可編輯的3D資產,並支持多種格式導出及與主流遊戲引擎對接。其技術架構統一了空間理解、生成與重建流程,核心升級包括HY-Pano-2.0模型、自研空間Agent技術和WorldStereo機制,顯著降低了遊戲關卡原型與具身智能仿真環境的構建門檻。

image.png

【AiBase提要:】

🧠 HY-World2.0實現了從生成視頻到生成可交互、可編輯3D資產的跨越。

🚀 支持多種格式導出,並與主流遊戲引擎無縫對接。

🌐 通過SOTA級空間一致性記憶機制,將AI驅動的3D內容創作推向實用化階段。

4、谷歌發佈最強TTS模型,支持近 70 種語言

谷歌推出的Gemini-TTS模型在文本轉語音領域實現了重大突破,通過提示詞直接調控語音的情感、節奏和風格,使語音更加自然細膩。同時,該模型支持約70種語言,並能自動識別語種,爲多語言內容的語音化提供了高效解決方案。

image.png

【AiBase提要:】

✨ Gemini-TTS支持通過提示詞精確控制語音情感、節奏和風格。

🌍 支持約70種語言,自動識別語種,無需手動標註。

🚀 與同系列音頻模型協同,提升實時對話和多模態交互體驗。

5、螞蟻靈波科技開源 LingBot-Map:支持單攝像頭實時流式三維重建

螞蟻靈波科技開源了流式三維重建模型LingBot-Map,該模型僅需單個普通RGB攝像頭即可在視頻採集過程中實時估計相機位姿並重建場景三維結構,爲機器人導航、自動駕駛及AR硬件等提供了高效、穩定且連續的在線建圖能力。

image.png

【AiBase提要:】

📱 支持單個普通RGB攝像頭實時估計相機位姿並重建場景三維結構。

🚀 採用流式處理架構,實現邊接收畫面邊輸出定位與結構的實時交互。

🌐 開源模型降低高精度三維感知的硬件門檻,加速具身智能設備發展。

詳情鏈接:https://huggingface.co/robbyant/lingbot-map ModelScope:https://www.modelscope.cn/models/Robbyant/lingbot-map

6、芒果TV會員破 7560 萬,自研大模型上崗 30 多檔節目,湖南廣電AI轉型成績單來了

湖南廣播電視臺在第十三屆中國網絡視聽大會上展示了其亮眼的成績單,包括芒果TV有效會員數量突破7560萬,以及自研芒果大模型在30多檔節目中的實際應用,顯著提升了生產效率。

【AiBase提要:】

🍊 芒果TV有效會員數量突破7560萬,顯示其在流媒體市場的競爭力。

🤖 湖南廣電自研的芒果大模型已孵化出80餘款智能體,並應用於30多檔節目,提升生產效率30%以上。

💡 芒果TV的AI轉型已具備可複製性,展示了傳統廣電機構在技術應用上的成功嘗試。

7、超 20 萬臺AI服務器暴露在攻擊風險下,MCP被曝存在嚴重設計缺陷

一份安全報告揭示了Anthropic的MCP協議存在嚴重設計缺陷,可能讓超過20萬臺AI服務器面臨遠程代碼執行的風險。該漏洞源於MCP SDK的STDIO接口,允許運行任何傳入的操作系統命令,且無校驗和警告。儘管OX Security已向Anthropic通報,但其僅更新了安全文檔,未對架構進行修改,引發開發者關注。

【AiBase提要:】

🧠 MCP架構設計缺陷可能導致遠程代碼執行,影響超過20萬臺AI服務器。

🛡️ 漏洞涉及Anthropic的MCP協議,覆蓋11種編程語言,風險廣泛。

⚠️ Anthropic未進行架構修改,僅更新安全文檔,引發開發者擔憂。

8、OpenAI 發佈更新版 Agents SDK 助力企業構建更安全的智能代理

OpenAI 對其 Agents SDK 進行了重磅更新,旨在幫助企業更安全、更高效地構建智能代理。這一更新引入了沙箱功能,允許智能代理在一個受控的計算環境中運行,從而有效保護系統的整體安全性。此外,新版 SDK 爲開發者提供了一個內置框架,支持在工作區中使用文件和已批准的工具,提升開發靈活性。OpenAI 表示,新的 Agents SDK 功能將通過 API 向所有客戶開放,並採用標準定價。目前,新的框架和沙箱功能將首先推出 Python 版本,TypeScript 支持將在後續版本中推出,未來還計劃引入更多 Agent 功能。

image.png

【AiBase提要:】

🛡️ OpenAI 更新 Agents SDK,引入沙箱功能,提高智能代理的安全性。

🔧 新版 SDK 提供內置框架,支持使用文件和已批准的工具,提升開發靈活性。

📈 API 將向所有客戶開放,Python 和 TypeScript 版本將陸續推出。