欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、阿里千问APP公测,与ChatGPT展开全面竞争

阿里巴巴推出的千问APP,基于Qwen3模型,旨在与ChatGPT展开全面竞争。千问APP公测版已在各大应用商店上线,并计划推出国际版。此外,Qwen3-Max的性能已超越GPT5等国际模型,成为全球前三。

image.png

【AiBase提要:】

🧠 阿里巴巴推出千问APP,基于Qwen3模型与ChatGPT竞争。

🚀 千问APP公测版已上线,并计划推出国际版争夺海外市场。

📈 Qwen3-Max性能超越GPT5等国际模型,成为全球前三。

2、Gemini Veo 3.1上线多图参考 一次合成三元素视频

谷歌向Gemini Pro/Ultra订阅用户推送Veo 3.1视频模型,新增“Ingredients to Video”模式,支持同时上传三张参考图,分别提取人物、场景与风格特征并融合为8秒1080p视频。该功能提升了视频生成的多样性和质量,同时保持了角色一致性和光影连贯。

111.jpg

【AiBase提要:】

🌟 新增“Ingredients to Video”模式,支持三张参考图生成视频。

🎨 视频内容自带SynthID隐形水印,提升版权保护。

🔊 同步输出原生环境音,增强视频沉浸感。

3、超级小爱AI大模型“随心修图”上线:一句话秒出大片

小米推出v7.8.50版本的超级小爱更新,新增‘随心修图’功能,用户可通过自然语言指令调用相册AI模型完成自动修图。该功能支持全局多模态交互,可识别屏幕与摄像头画面并执行复杂操作链。

image.png

【AiBase提要:】

📱 超级小爱新增‘随心修图’功能,用户通过自然语言指令即可实现自动修图。

📷 支持全局多模态交互,可识别屏幕与摄像头画面并执行复杂操作链。

🖼️ 功能基于7B多模态大模型,可在本地完成推理,默认输出带水印,并保留原图备份。

4、小米开源7B多模态模型MiMo-VL 推AI管家Miloco

小米在Hugging Face与GitHub同步发布了7B参数多模态大模型‘Xiaomi-MiMo-VL-Miloco-7B-GGUF’,并推出了基于该模型的智能管家‘Xiaomi Miloco’。Miloco能够通过米家摄像头识别用户活动和手势,并自动联动智能家居设备,同时兼容Home Assistant协议。该模型采用非商用开源许可,用户可在配备NVIDIA GPU与Docker环境的Windows或Linux主机一键部署。

【AiBase提要:】

🚀 小米发布7B参数多模态大模型‘Xiaomi-MiMo-VL-Miloco-7B-GGUF’。

💡 智能管家‘Xiaomi Miloco’可识别用户活动及手势,联动智能家居设备。

🔒 模型采用非商用开源许可,支持在NVIDIA GPU与Docker环境下部署。

5、Google Flow集成Nano Banana模型 一键抠图直出视频素材

谷歌为AI电影工具Flow新增图像编辑模块,深度集成Gemini2.5Flash图像模型(代号Nano Banana),支持自然语言一键去背景、主体分离与场景替换,并可直接拖入时间线生成8秒动态镜头。该功能面向Gemini免费版及以上用户开放,定价0.039美元/张,企业级Vertex AI同步上线。

【AiBase提要:】

🔥 集成Gemini2.5Flash图像模型,实现自然语言控制图像编辑。

💡 支持一键去背景、主体分离与场景替换,提升视频制作效率。

🌐 提供API批量接口,目标覆盖短视频、电商海报等高产出场景。

6、新一代多模态 AI DeepEyesV2:智能工具助力超越更大模型

DeepEyesV2是一款由研究人员推出的多模态AI模型,能够分析图像、执行代码并进行网络搜索。它通过智能利用外部工具,在多个任务中表现出色,甚至在某些情况下超越了更大的模型。

image.png

【AiBase提要:】

🌟 DeepEyesV2利用智能工具提升多模态任务的表现,超越大型模型。

🔧 采用两阶段训练流程,结合图像理解与工具使用。

📈 在多个基准测试中表现优秀,展现出较小模型的潜力。

详情链接:https://arxiv.org/abs/2511.05271

7、NotebookLM升级支持图像导入 板书秒变可检索知识库

谷歌推出NotebookLM新功能,支持用户上传黑板板书、教科书扫描页或街拍表格,并通过OCR与语义解析实现自然语言检索。该功能面向全平台免费,未来将增加本地处理选项以保护敏感数据。

image.png

【AiBase提要:】

📷 支持图像数据源,提升笔记管理效率

🧠 多模态模型识别手写与印刷内容,提取表格结构

🔍 实现图像内容的自然语言检索,增强信息获取能力

8、JetBrains 推出 AI 编码智能体基准测试平台 DPAI Arena

JetBrains 推出了 DPAI Arena,这是首个开放式、多语言、多框架和多工作流的 AI 编码智能体基准测试平台。该平台旨在评估 AI 工具在软件开发中的效率,并支持多种编程语言和工作流程,能够公平、可重复地比较 AI 工具的性能。

【AiBase提要:】

🌟 DPAI Arena 是业内首个开放式 AI 编码智能体基准测试平台,旨在评估 AI 工具在软件开发中的效率。

🛠️ 该平台支持多种编程语言和工作流程,能够公平、可重复地比较 AI 工具的性能。

🤝 JetBrains 计划将该项目交给 Linux Foundation,以促进更广泛的技术指导和未来发展。

详情链接:https://dpaia.dev/