AI日報：騰訊開源3D世界模型HunyuanWorld-Voyager；即夢AI系列模型開放API；通義推智能體開發框架AgentScope 1.0

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、騰訊開源具備原生3D重建能力的超長程世界模型：HunyuanWorld-Voyager

騰訊發佈的HunyuanWorld-Voyager是一種創新的視頻擴散框架，能夠基於單張輸入圖像生成具有世界一致性的3D點雲，並支持沉浸式探索。該模型在視頻生成質量和場景重建效果上表現出色，展現了其在AI驅動的VR、遊戲和仿真空間智能領域的潛力。

【AiBase提要:】
🌍 HunyuanWorld-Voyager能基於單張輸入圖像生成具有世界一致性的3D點雲，支持用戶沉浸式探索。
🎥 模型同時生成精確對齊的深度信息和RGB視頻，適用於高質量三維重建。
🏆 在多個測試中，HunyuanWorld-Voyager在視頻生成質量和場景重建效果上均優於其他模型。

2、通義實驗室推出新一代智能體開發框架AgentScope 1.0

通義實驗室推出的AgentScope 1.0是一個專注於多智能體開發的開源框架，提供全生命週期解決方案，包括開發、部署和監控。其三層技術架構（核心框架、Runtime和Studio）支持獨立使用，具備實時介入控制、智能上下文管理和高效工具調用三大能力，確保了智能體的安全性和運行效率。

【AiBase提要:】
🌟 AgentScope 1.0是新一代智能體開發框架，專注於多智能體的開發，提供全生命週期解決方案。
🚀 具備實時介入控制、智能上下文管理和高效工具調用三大能力，提高智能體的開發和運行效率。
🔒 AgentScope Runtime 提供安全的工具沙箱和高效的部署運行引擎，確保智能體的安全與穩定。
詳情鏈接:https://github.com/agentscope-ai/agentscope

3、即夢AI系列模型開放API，爲開發者提供一站式圖像與視頻生成服務

即夢AI與火山引擎全面開放API服務，爲企業提供強大的圖像和視頻生成能力，助力創意轉化爲現實。

【AiBase提要:】
🎨 文生圖3.0、文生圖3.1等模型開放API服務，助力企業高效生成圖像和視頻內容。
🎬 視頻生成3.0pro與動作模仿DreamActor M1等模型支持多樣化的創作需求。
💼 即夢AI通過火山引擎賦能企業級市場，推動商業應用的創新發展。

4、騰訊開源翻譯巨頭 Hunyuan-MT-7B：斬獲 WMT2025 三十項冠軍，翻譯界的新霸主！

騰訊推出的 Hunyuan-MT-7B 在 WMT2025 中表現卓越，成爲翻譯領域的佼佼者，展現了其在多語言處理上的強大實力，並通過開源方式推動技術的廣泛應用和發展。

【AiBase提要:】
🧪 Hunyuan-MT-7B 在 WMT2025 中斬獲 30 個語種的第一名，展現強大的翻譯能力。
🌐 支持 31 種語言，包括多種小衆語言，體現騰訊在自然語言處理領域的技術積累。
🚀 開源模式推動技術發展，助力全球交流與合作。

5、蘋果推出 STARFlow：全新 AI 圖像生成技術想力壓 DALL-E 與 Midjourney

蘋果公司推出的 STARFlow AI 圖像生成系統在技術上實現了突破，結合了正則化流和自迴歸變換器，提高了高分辨率圖像生成的效率和質量。該系統通過深淺設計和潛在空間操作優化模型性能，並且與學術機構合作推動 AI 技術的發展。

【AiBase提要:】
🧠 STARFlow 結合正則化流和自迴歸變換器，提升圖像生成效率。
💡 通過深淺設計和潛在空間操作優化模型表現。
🚀 蘋果與學術機構合作推動 AI 技術發展，未來應用前景廣闊。
詳情鏈接:https://arxiv.org/pdf/2506.06276

6、蘋果 FastVLM 上線:5分鐘體驗85倍速視覺 AI，數據永不出設備

蘋果推出的 FastVLM 視覺語言模型現已向公衆開放，基於 Apple Silicon 芯片的 Mac 可直接體驗。FastVLM 在視頻字幕處理速度上提升了85倍，同時體積縮小了3倍以上，支持在瀏覽器中加載輕量級版本，無需複雜安裝過程。其本地化運行設計確保數據永不離開設備，爲隱私保護提供了理想解決方案。

【AiBase提要:】
🍎 FastVLM 提供近乎即時高分辨率圖像處理能力，提升視頻字幕處理速度85倍。
💻 支持在瀏覽器中加載輕量級版本，無需複雜安裝即可體驗強大功能。
🔒 數據完全在本地運行，確保隱私安全且支持離線使用。

7、新模型 CoMPaSS-FLUX.1：提升Flux文本到圖像生成的空間理解能力

CoMPaSS-FLUX.1是一種基於 FLUX.1 文本到圖像擴散模型的 LoRA 適配器，旨在顯著提升生成圖像時對物體空間關係的理解能力。該模型在多個基準測試中表現出色，特別是在處理物體之間的空間關係方面取得了顯著進展。

【AiBase提要:】
🌟 CoMPaSS-FLUX.1提升了文本到圖像生成的空間理解能力，尤其在處理物體之間關係上表現突出。
📊 性能評估顯示該模型在多個基準測試中都有明顯提升，同時保持了高質量的生成效果。
📚 模型訓練使用了嚴格篩選的數據集，確保生成圖像在視覺上具有良好的空間關係和清晰度。
詳情鏈接:https://huggingface.co/blurgy/CoMPaSS-FLUX.1

8、Cherry Studio 與硅基流動深度合作，免費提供 Qwen38B 模型

Cherry Studio 與硅基流動深度合作，爲用戶提供免費的 Qwen38B 模型，進一步豐富其多模型支持能力，提升 AI 交互體驗。

【AiBase提要:】
🧠 Cherry Studio 與硅基流動合作，免費提供 Qwen38B 模型，提升 AI 交互體驗。
💻 支持多平臺及多種主流大語言模型，簡化用戶使用流程。
🚀 提供跨行業智能助手，增強生產力和個性化功能。

9、谷歌推全新Gemini API URL Context 功能可詳解網頁內容

谷歌推出的 Gemini API URL Context 功能，讓 AI 能夠精準解析和理解網頁內容，極大簡化了開發者的流程，提高了信息提取效率。

【AiBase提要:】
🌐 專爲開發者設計的 API，可解析和理解網頁中的所有內容，包括 PDF、圖片等多種格式。
📊 支持處理高達34MB 的網頁內容，能夠提取關鍵數據如“總資產”和“總負債”。
🔒 無法突破付費牆，且對專用工具如 YouTube 視頻和 Google Docs 不進行處理。
詳情鏈接:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/

10、Youtu-Agent 智能體框架正式開源，引領 AI 發展新潮流

騰訊優圖實驗室開源了Youtu-Agent框架，該框架專爲構建、運行和評估自主AI智能體而設計，具備高性能、靈活性和對開源模型的支持。其在多項基準測試中表現優異，成爲AI社區的重要工具。

【AiBase提要:】
✅ Youtu-Agent框架支持多種任務，如數據分析和文件處理，提升開發效率。
🚀 模塊化設計使開發者能夠靈活調整智能體行爲，便於定製化應用。
🌐 開源策略鼓勵全球開發者參與，推動AI技術的創新與協作。
詳情鏈接:https://github.com/TencentCloudADP/Youtu-agent

AI日報：騰訊開源3D世界模型HunyuanWorld-Voyager；即夢AI系列模型開放API；通義推智能體開發框架AgentScope 1.0

相關推薦

AI日報：GPT5.6系列模型發佈 Codex消失;騰訊擬接盤Manus成最大股東；MiniMax創始人宣佈零薪酬直至實現AGI

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

三星殺回PC芯片戰場：自研AI專用芯片GAIA已送測聯想惠普， 2027 年量產

騰訊擬接盤Manus成最大股東，估值20億美元發力智能體生態

吸金 20 億美元！MiniMax完成 160 億港元新一輪融資，獲超 7 倍超額認購

AI日報：騰訊開源3D世界模型HunyuanWorld-Voyager；即夢AI系列模型開放API；通義推智能體開發框架AgentScope 1.0

相關推薦

AI日報：GPT5.6系列模型發佈 Codex消失;騰訊擬接盤Manus成最大股東；MiniMax創始人宣佈零薪酬直至實現AGI

​Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

三星殺回PC芯片戰場：自研AI專用芯片GAIA已送測聯想惠普， 2027 年量產

騰訊擬接盤Manus成最大股東，估值20億美元發力智能體生態

吸金 20 億美元！MiniMax完成 160 億港元新一輪融資，獲超 7 倍超額認購

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能