AI日報：阿里推多模態模型Qwen3-Omni；谷歌推出AP2協議；百度推出Qianfan-VL 模型

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、阿里雲推出全球首個全模態 AI 模型 Qwen3-Omni，實現文本、圖像、音頻與視頻的統一處理

阿里雲發佈了 Qwen3-Omni，這是全球首個原生端到端全模態 AI 模型，支持文本、圖像、音頻和視頻的統一處理。該模型在多個領域展現出跨模態的先進表現，並且已開源，能夠滿足全球用戶的多語言需求。

【AiBase提要:】
🌟 Qwen3-Omni 是全球首個原生端到端全模態 AI 模型，支持文本、圖像、音頻和視頻的統一處理。
🌐 模型支持119種文本語言和19種語音輸入，能夠滿足全球用戶的多語言需求。
🖼️ 新發布的 Qwen-Image-Edit-2509 支持多圖像編輯，顯著提升編輯的一致性和效果。
詳情鏈接:https://github.com/QwenLM/Qwen3-Omni huggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

2、告別P圖煩惱!阿里Qwen-Image多圖像編輯功能一鍵合成專業級廣告大片

文章介紹了阿里巴巴旗下AI圖像編輯工具Qwen-Image的重大功能升級，包括新增多圖像編輯功能、引入ControlNet關鍵點地圖技術以及擴展應用場景至模因製作，爲電子商務和數字營銷行業提供了更高效的解決方案。

【AiBase提要:】
🖼️ 新增多圖像編輯功能，支持人+人、人+產品、人+場景的靈活組合。
⚙️ 引入ControlNet關鍵點地圖功能，提升人物姿勢控制精度。
🛒 擴展應用場景，支持模因製作，助力電商和營銷行業。
詳情鏈接:https://chat.qwen.ai/?inputFeature=image_edit

3、百度推出 Qianfan-VL 模型多尺寸模型滿足不同場景需求

百度智能雲千帆團隊推出了全新視覺理解模型 Qianfan-VL，該模型包括3B、8B 和70B 三種尺寸，針對企業級多模態應用進行了深度優化。Qianfan-VL 在OCR、教育場景和數學解題方面表現出色，並且在基準測試中展現了出色的通用能力和特定任務的優秀表現。

【AiBase提要:】
🧠 多尺寸模型滿足不同場景需求
📊 8B 和70B 模型具備思考推理能力
📄 OCR 和文檔理解表現優異
詳情鏈接:https://baidubce.github.io/Qianfan-VL/

4、谷歌推出 AP2 協議，攜手 PayPal 開啓 AI 支付新時代

谷歌推出的AP2協議爲AI支付提供了安全可靠的框架，通過授權令牌機制確保交易的合法性和安全性，同時與PayPal合作推動AI在支付領域的創新和應用。

【AiBase提要:】
🛒 AP2協議爲AI支付提供安全授權機制，確保交易合法性。
🤝 谷歌與PayPal合作，推動AI在支付領域的實際應用。
🔒 授權令牌系統明確責任劃分，提升交易透明度。
詳情鏈接:https://github.com/google-agentic-commerce/AP2

5、蘋果擴展圖像生成平臺:Image Playground 將引入更多第三方AI模型

蘋果在 macOS Tahoe26、iPadOS26 和 iOS26 中對 Image Playground 進行了重大更新，引入了 ChatGPT 作爲圖像生成模型，並計劃支持更多第三方模型，如 Google 的 Gemini2.5Flash Image。

【AiBase提要:】
🍎 蘋果擴展 Image Playground 支持更多第三方 AI 模型，包括 OpenAI 和 Google 的 Gemini2.5Flash Image。
⚙️ 新增“估計延遲”指標和“提供商標識符”，表明蘋果正在優化模型選擇機制。
🔒 蘋果可能更傾向於與外部合作伙伴合作，而非直接支持開源模型，以確保圖像生成工具的安全性。

6、一鍵變身學習機！百度搜索推出AI伴學

百度推出AI伴學，通過AI技術將普通手機轉變爲學習機，爲學生提供精準練、口語訓練等功能，助力教育公平和資源普及。

【AiBase提要:】
📚 AI伴學通過AI技術將普通手機變爲學習機，提升教育公平性。
🗣️ 提供AI口語、作文批改等工具，助力學生個性化學習。
🌍 百度教育團隊利用文心4.5等技術推動教育資源整合與普及。

7、釘釘AI表格助理正式上線：一句話生成表格，打造企業級AI應用平臺

釘釘推出AI表格助理，將AI表格升級爲面向AI時代的應用創建平臺。用戶只需更新到最新版本，即可體驗這一新功能。AI表格助理支持自然語言描述想法，自動生成表格、自動化工作流和數據分析儀表盤，大大降低了使用門檻。

【AiBase提要:】
✨ AI表格助理支持自然語言描述想法，自動生成表格、自動化工作流和數據分析儀表盤。
🚀 引入字段Agent，新增30款Agent，支持AI視頻理解、數字人等多模態AI能力。
🌐 跨平臺工作流支持，新增對百鍊、Coze等平臺工作流的支持，實現跨平臺的數據彙總和分析。

8、DeepSeek-V3.1-Terminus 重磅發佈:性能全面提升，深度推理能力顯著增強

DeepSeek 發佈了 DeepSeek-V3.1-Terminus 模型，並將其開源。該模型在原有基礎上修復了語言不一致和異常字符問題，優化了編程和搜索智能體的性能。基準測試數據顯示，其性能提升了0.2%至36.5%，尤其在高難度知識、多模態和深度推理方面表現突出。

【AiBase提要:】
🧠 DeepSeek-V3.1-Terminus 模型性能全面升級，提升幅度達0.2%-36.5%
🚀 重點優化了編程和搜索智能體的性能，解決了舊版的語言不一致問題
🔍 在 HLE 測試中表現尤爲出色，展示了強大的深度推理與多模態處理能力
詳情鏈接:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

9、Kimi Agent會員驚喜上線！打賞秒變9個月VIP，49元享超值AI深度研究

Kimi推出了全新的Agent會員服務，爲早期打賞用戶提供了額外的福利，同時通過音樂節拍命名的會員體系，展現了品牌創意。深度研究功能基於專有模型，提供專業洞見，推動了AI助手向智能化代理演進。

【AiBase提要:】
✨ Kimi推出Agent會員服務，打賞用戶可獲得額外會員時長。
🎵 會員體系以古典音樂節拍術語命名，融合藝術與科技。
🔍 深度研究功能基於專有模型，提供多維度觀點分析和認知發現。

10、全球首個通用具身智能模型開源！智元機器人GO-1震撼來襲

智元機器人宣佈其GO-1通用具身基座大模型全面開源，這是全球首個採用ViLLA架構的具身智能模型，能夠理解和執行復雜任務。這一舉措將推動具身智能的應用和研究，降低技術門檻，並吸引更多的開發者參與該生態系統，促進跨領域的創新與合作。

【AiBase提要:】
🤖 GO-1是全球首個採用ViLLA架構的具身智能模型，結合視覺、語言和潛在動作能力。
💡 開源GO-1將推動具身智能的應用和研究，降低技術門檻。
🌐 智元機器人希望吸引更多開發者參與具身智能生態系統，促進跨領域創新與合作。

AI日報：阿里推多模態模型Qwen3-Omni；谷歌推出AP2協議；百度推出Qianfan-VL 模型

相關推薦

螞蟻百靈發佈新一代原生混合推理模型Ling-3.0-Flash

皮查伊確認Gemini4 已投入訓練，谷歌AI旗艦型號年底見分曉

腦電波訓練機器人：物理AI的下一個突破口藏在人腦信號裏

美團闢謠LongCat模型負責人離職，持續推進國產算力萬億大模型落地

千問辦公悄然開啓內測主打25項企業 IM 能力與多形態產物一站式交付

AI日報：阿里推多模態模型Qwen3-Omni；谷歌推出AP2協議；百度推出Qianfan-VL 模型

相關推薦

螞蟻百靈發佈新一代原生混合推理模型Ling-3.0-Flash

皮查伊確認Gemini4 已投入訓練，谷歌AI旗艦型號年底見分曉

​腦電波訓練機器人：物理AI的下一個突破口藏在人腦信號裏

美團闢謠LongCat模型負責人離職，持續推進國產算力萬億大模型落地

千問辦公悄然開啓內測 主打25項企業 IM 能力與多形態產物一站式交付

腦電波訓練機器人：物理AI的下一個突破口藏在人腦信號裏

千問辦公悄然開啓內測主打25項企業 IM 能力與多形態產物一站式交付