歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、阿里千問APP公測,與ChatGPT展開全面競爭

阿里巴巴推出的千問APP,基於Qwen3模型,旨在與ChatGPT展開全面競爭。千問APP公測版已在各大應用商店上線,並計劃推出國際版。此外,Qwen3-Max的性能已超越GPT5等國際模型,成爲全球前三。

image.png

【AiBase提要:】

🧠 阿里巴巴推出千問APP,基於Qwen3模型與ChatGPT競爭。

🚀 千問APP公測版已上線,並計劃推出國際版爭奪海外市場。

📈 Qwen3-Max性能超越GPT5等國際模型,成爲全球前三。

2、Gemini Veo 3.1上線多圖參考 一次合成三元素視頻

谷歌向Gemini Pro/Ultra訂閱用戶推送Veo 3.1視頻模型,新增“Ingredients to Video”模式,支持同時上傳三張參考圖,分別提取人物、場景與風格特徵並融合爲8秒1080p視頻。該功能提升了視頻生成的多樣性和質量,同時保持了角色一致性和光影連貫。

111.jpg

【AiBase提要:】

🌟 新增“Ingredients to Video”模式,支持三張參考圖生成視頻。

🎨 視頻內容自帶SynthID隱形水印,提升版權保護。

🔊 同步輸出原生環境音,增強視頻沉浸感。

3、超級小愛AI大模型“隨心修圖”上線:一句話秒出大片

小米推出v7.8.50版本的超級小愛更新,新增‘隨心修圖’功能,用戶可通過自然語言指令調用相冊AI模型完成自動修圖。該功能支持全局多模態交互,可識別屏幕與攝像頭畫面並執行復雜操作鏈。

image.png

【AiBase提要:】

📱 超級小愛新增‘隨心修圖’功能,用戶通過自然語言指令即可實現自動修圖。

📷 支持全局多模態交互,可識別屏幕與攝像頭畫面並執行復雜操作鏈。

🖼️ 功能基於7B多模態大模型,可在本地完成推理,默認輸出帶水印,並保留原圖備份。

4、小米開源7B多模態模型MiMo-VL 推AI管家Miloco

小米在Hugging Face與GitHub同步發佈了7B參數多模態大模型‘Xiaomi-MiMo-VL-Miloco-7B-GGUF’,並推出了基於該模型的智能管家‘Xiaomi Miloco’。Miloco能夠通過米家攝像頭識別用戶活動和手勢,並自動聯動智能家居設備,同時兼容Home Assistant協議。該模型採用非商用開源許可,用戶可在配備NVIDIA GPU與Docker環境的Windows或Linux主機一鍵部署。

【AiBase提要:】

🚀 小米發佈7B參數多模態大模型‘Xiaomi-MiMo-VL-Miloco-7B-GGUF’。

💡 智能管家‘Xiaomi Miloco’可識別用戶活動及手勢,聯動智能家居設備。

🔒 模型採用非商用開源許可,支持在NVIDIA GPU與Docker環境下部署。

5、Google Flow集成Nano Banana模型 一鍵摳圖直出視頻素材

谷歌爲AI電影工具Flow新增圖像編輯模塊,深度集成Gemini2.5Flash圖像模型(代號Nano Banana),支持自然語言一鍵去背景、主體分離與場景替換,並可直接拖入時間線生成8秒動態鏡頭。該功能面向Gemini免費版及以上用戶開放,定價0.039美元/張,企業級Vertex AI同步上線。

【AiBase提要:】

🔥 集成Gemini2.5Flash圖像模型,實現自然語言控制圖像編輯。

💡 支持一鍵去背景、主體分離與場景替換,提升視頻製作效率。

🌐 提供API批量接口,目標覆蓋短視頻、電商海報等高產出場景。

6、新一代多模態 AI DeepEyesV2:智能工具助力超越更大模型

DeepEyesV2是一款由研究人員推出的多模態AI模型,能夠分析圖像、執行代碼並進行網絡搜索。它通過智能利用外部工具,在多個任務中表現出色,甚至在某些情況下超越了更大的模型。

image.png

【AiBase提要:】

🌟 DeepEyesV2利用智能工具提升多模態任務的表現,超越大型模型。

🔧 採用兩階段訓練流程,結合圖像理解與工具使用。

📈 在多個基準測試中表現優秀,展現出較小模型的潛力。

詳情鏈接:https://arxiv.org/abs/2511.05271

7、NotebookLM升級支持圖像導入 板書秒變可檢索知識庫

谷歌推出NotebookLM新功能,支持用戶上傳黑板板書、教科書掃描頁或街拍表格,並通過OCR與語義解析實現自然語言檢索。該功能面向全平臺免費,未來將增加本地處理選項以保護敏感數據。

image.png

【AiBase提要:】

📷 支持圖像數據源,提升筆記管理效率

🧠 多模態模型識別手寫與印刷內容,提取表格結構

🔍 實現圖像內容的自然語言檢索,增強信息獲取能力

8、JetBrains 推出 AI 編碼智能體基準測試平臺 DPAI Arena

JetBrains 推出了 DPAI Arena,這是首個開放式、多語言、多框架和多工作流的 AI 編碼智能體基準測試平臺。該平臺旨在評估 AI 工具在軟件開發中的效率,並支持多種編程語言和工作流程,能夠公平、可重複地比較 AI 工具的性能。

【AiBase提要:】

🌟 DPAI Arena 是業內首個開放式 AI 編碼智能體基準測試平臺,旨在評估 AI 工具在軟件開發中的效率。

🛠️ 該平臺支持多種編程語言和工作流程,能夠公平、可重複地比較 AI 工具的性能。

🤝 JetBrains 計劃將該項目交給 Linux Foundation,以促進更廣泛的技術指導和未來發展。

詳情鏈接:https://dpaia.dev/