歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、阿里雲推出全球首個全模態 AI 模型 Qwen3-Omni,實現文本、圖像、音頻與視頻的統一處理
阿里雲發佈了 Qwen3-Omni,這是全球首個原生端到端全模態 AI 模型,支持文本、圖像、音頻和視頻的統一處理。該模型在多個領域展現出跨模態的先進表現,並且已開源,能夠滿足全球用戶的多語言需求。

【AiBase提要:】
🌟 Qwen3-Omni 是全球首個原生端到端全模態 AI 模型,支持文本、圖像、音頻和視頻的統一處理。
🌐 模型支持119種文本語言和19種語音輸入,能夠滿足全球用戶的多語言需求。
🖼️ 新發布的 Qwen-Image-Edit-2509 支持多圖像編輯,顯著提升編輯的一致性和效果。
詳情鏈接:https://github.com/QwenLM/Qwen3-Omni huggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe
2、告別P圖煩惱!阿里Qwen-Image多圖像編輯功能一鍵合成專業級廣告大片
文章介紹了阿里巴巴旗下AI圖像編輯工具Qwen-Image的重大功能升級,包括新增多圖像編輯功能、引入ControlNet關鍵點地圖技術以及擴展應用場景至模因製作,爲電子商務和數字營銷行業提供了更高效的解決方案。

【AiBase提要:】
🖼️ 新增多圖像編輯功能,支持人+人、人+產品、人+場景的靈活組合。
⚙️ 引入ControlNet關鍵點地圖功能,提升人物姿勢控制精度。
🛒 擴展應用場景,支持模因製作,助力電商和營銷行業。
詳情鏈接:https://chat.qwen.ai/?inputFeature=image_edit
3、百度推出 Qianfan-VL 模型 多尺寸模型滿足不同場景需求
百度智能雲千帆團隊推出了全新視覺理解模型 Qianfan-VL,該模型包括3B、8B 和70B 三種尺寸,針對企業級多模態應用進行了深度優化。Qianfan-VL 在OCR、教育場景和數學解題方面表現出色,並且在基準測試中展現了出色的通用能力和特定任務的優秀表現。
【AiBase提要:】
🧠 多尺寸模型滿足不同場景需求
📊 8B 和70B 模型具備思考推理能力
📄 OCR 和文檔理解表現優異
詳情鏈接:https://baidubce.github.io/Qianfan-VL/
4、谷歌推出 AP2 協議,攜手 PayPal 開啓 AI 支付新時代
谷歌推出的AP2協議爲AI支付提供了安全可靠的框架,通過授權令牌機制確保交易的合法性和安全性,同時與PayPal合作推動AI在支付領域的創新和應用。

【AiBase提要:】
🛒 AP2協議爲AI支付提供安全授權機制,確保交易合法性。
🤝 谷歌與PayPal合作,推動AI在支付領域的實際應用。
🔒 授權令牌系統明確責任劃分,提升交易透明度。
詳情鏈接:https://github.com/google-agentic-commerce/AP2
5、蘋果擴展圖像生成平臺:Image Playground 將引入更多第三方AI模型
蘋果在 macOS Tahoe26、iPadOS26 和 iOS26 中對 Image Playground 進行了重大更新,引入了 ChatGPT 作爲圖像生成模型,並計劃支持更多第三方模型,如 Google 的 Gemini2.5Flash Image。

【AiBase提要:】
🍎 蘋果擴展 Image Playground 支持更多第三方 AI 模型,包括 OpenAI 和 Google 的 Gemini2.5Flash Image。
⚙️ 新增“估計延遲”指標和“提供商標識符”,表明蘋果正在優化模型選擇機制。
🔒 蘋果可能更傾向於與外部合作伙伴合作,而非直接支持開源模型,以確保圖像生成工具的安全性。
6、一鍵變身學習機!百度搜索推出AI伴學
百度推出AI伴學,通過AI技術將普通手機轉變爲學習機,爲學生提供精準練、口語訓練等功能,助力教育公平和資源普及。
【AiBase提要:】
📚 AI伴學通過AI技術將普通手機變爲學習機,提升教育公平性。
🗣️ 提供AI口語、作文批改等工具,助力學生個性化學習。
🌍 百度教育團隊利用文心4.5等技術推動教育資源整合與普及。
7、釘釘AI表格助理正式上線:一句話生成表格,打造企業級AI應用平臺
釘釘推出AI表格助理,將AI表格升級爲面向AI時代的應用創建平臺。用戶只需更新到最新版本,即可體驗這一新功能。AI表格助理支持自然語言描述想法,自動生成表格、自動化工作流和數據分析儀表盤,大大降低了使用門檻。
【AiBase提要:】
✨ AI表格助理支持自然語言描述想法,自動生成表格、自動化工作流和數據分析儀表盤。
🚀 引入字段Agent,新增30款Agent,支持AI視頻理解、數字人等多模態AI能力。
🌐 跨平臺工作流支持,新增對百鍊、Coze等平臺工作流的支持,實現跨平臺的數據彙總和分析。
8、DeepSeek-V3.1-Terminus 重磅發佈:性能全面提升,深度推理能力顯著增強
DeepSeek 發佈了 DeepSeek-V3.1-Terminus 模型,並將其開源。該模型在原有基礎上修復了語言不一致和異常字符問題,優化了編程和搜索智能體的性能。基準測試數據顯示,其性能提升了0.2%至36.5%,尤其在高難度知識、多模態和深度推理方面表現突出。
【AiBase提要:】
🧠 DeepSeek-V3.1-Terminus 模型性能全面升級,提升幅度達0.2%-36.5%
🚀 重點優化了編程和搜索智能體的性能,解決了舊版的語言不一致問題
🔍 在 HLE 測試中表現尤爲出色,展示了強大的深度推理與多模態處理能力
詳情鏈接:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
9、Kimi Agent會員驚喜上線!打賞秒變9個月VIP,49元享超值AI深度研究
Kimi推出了全新的Agent會員服務,爲早期打賞用戶提供了額外的福利,同時通過音樂節拍命名的會員體系,展現了品牌創意。深度研究功能基於專有模型,提供專業洞見,推動了AI助手向智能化代理演進。

【AiBase提要:】
✨ Kimi推出Agent會員服務,打賞用戶可獲得額外會員時長。
🎵 會員體系以古典音樂節拍術語命名,融合藝術與科技。
🔍 深度研究功能基於專有模型,提供多維度觀點分析和認知發現。
10、全球首個通用具身智能模型開源!智元機器人GO-1震撼來襲
智元機器人宣佈其GO-1通用具身基座大模型全面開源,這是全球首個採用ViLLA架構的具身智能模型,能夠理解和執行復雜任務。這一舉措將推動具身智能的應用和研究,降低技術門檻,並吸引更多的開發者參與該生態系統,促進跨領域的創新與合作。
【AiBase提要:】
🤖 GO-1是全球首個採用ViLLA架構的具身智能模型,結合視覺、語言和潛在動作能力。
💡 開源GO-1將推動具身智能的應用和研究,降低技術門檻。
🌐 智元機器人希望吸引更多開發者參與具身智能生態系統,促進跨領域創新與合作。
