欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、OpenAI 下一代图像生成模型疑似现身,已在 Design Arena 与 LM Arena 开启盲测

OpenAI 正在对两款代号分别为“Chestnut”和“Hazelnut”的全新图像生成模型进行小规模盲测,这标志着其在文本到图像领域的重要进展。新模型在多个关键维度表现出显著提升,包括世界知识理解能力、图像真实感以及代码嵌入能力。

image.png

【AiBase提要:】

🧠 新模型在世界知识理解能力上已基本与谷歌最新 Nano Banana Pro 持平。

📷 新模型能生成接近摄影级真实感的名人风格自拍,面部细节、五官比例、光影处理均大幅优于 gpt-image-1。

💻 新模型在图像中嵌入可读代码方面表现尤为突出,能准确渲染复杂代码片段、流程图标签及数学公式。

2、一张图秒变AI风格神器!Qwen-Image-i2L颠覆图像生成,零门槛LoRA训练来袭

Qwen-Image-i2L是一项革命性技术,能够将任意单张图片转化为可微调的LoRA模型,极大降低了个性化风格迁移的门槛。它采用多模态特征提取体系,将输入图片智能拆解为“风格、内容、构图、色调”等核心视觉元素,并形成一个体积小巧的LoRA模块。文章还介绍了四种专属模型风格,以及其技术底蕴和潜在挑战。

image.png

【AiBase提要:】

🖼️ 核心创新:从单图到LoRA,一键解锁个性化生成

🎨 四款模型变体,精准适配多元场景

🚀 技术底蕴与潜在挑战:高效却需警惕过拟合

详情链接:https://modelscope.cn/models/DiffSynth-Studio/Qwen-Image-i2L/summary

3、智谱 AI 输入法全新发布,语音识别技术同步开源!

智谱 AI 推出了 GLM-ASR 系列语音识别模型,并开源了相关技术,旨在提升用户的语音交互体验。同时,推出了桌面端的智谱 AI 输入法,支持语音转文字、翻译和文本改写等功能,为用户提供便捷的 PC 端语音交互体验。新用户还可获得2000积分,享受28天的免费使用时间。

【AiBase提要:】

🌟 GLM-ASR 系列模型发布,包含全球领先的云端语音识别模型和端侧模型,识别精度出色。

🛠️ 新款智谱 AI 输入法推出,支持语音转文字、翻译及改写,提供便捷的 PC 端语音交互体验。

🎁 新用户可免费获取2000积分,享受长达28天的使用权,鼓励更多用户体验智能输入法。

详情链接:https://huggingface.co/zai-org/GLM-ASR-Nano-2512

4、灵光上线新能力:一键生成科普动画,复杂原理可视化呈现

通用AI助手“灵光”推出了全新的科普动画生成功能,旨在通过直观、生动的动画形式解释复杂的科学原理,提升学习效果。该功能覆盖多个核心科学与工程领域,并已融入对话功能,用户可即时触发获取动态解释。

image.png

【AiBase提要:】

🧪 通用AI助手“灵光”推出科普动画生成功能,将抽象科学原理可视化呈现。

🌍 灵光能自动生成模拟动画,帮助用户理解天文学、物理学等领域的复杂概念。

🔄 该功能已融入对话功能,用户可即时触发并获取动态解释。

5、麦当劳 AI 生成的圣诞广告因嘲讽声潮而被撤回

麦当劳荷兰分公司推出的AI生成圣诞广告因反传统观点和视觉效果不佳遭到强烈批评,最终被撤回。尽管制作方声称投入了大量时间和人力,但公众对广告的反感依然明显。

【AiBase提要:】

🌟 麦当劳荷兰分公司推出AI生成圣诞广告,因反传统观点和视觉效果差遭网友批评并撤回。

🎬 广告内容快速切换场景和奇怪角色引发观众不满,画面质量堪忧。

💼 制作公司为广告辩护,称投入大量人力,但公众反响仍然负面。

6、马斯克的 xAI 推出新工具,可在电影中实时植入 AI 广告

马斯克的xAI推出了一款名为Halftime的新工具,能够将AI生成的广告实时植入电影和电视剧中,使广告与剧情融合。然而,这一技术引发了关于电影艺术完整性和版权问题的广泛讨论。

【AiBase提要:】

🌟 Halftime 是一款可以实时将 AI 生成的广告植入到电影和电视剧中的工具。

🎥 该工具可以在角色对话中打断并展示产品,力求让广告看起来像剧情的一部分。

📜 引发的争议让人们担忧这一技术可能会影响电影艺术的完整性。

7、阿里组建千问C端事业群:整合夸克、UC,挑战超级APP地位

阿里巴巴集团宣布成立“千问C端事业群”,整合原智能信息与智能互联两大事业群的核心资源,目标是将“千问”打造为AI时代的超级APP,成为用户进入数字生活的第一入口。同时,计划拓展至眼镜、PC、汽车等多终端场景,构建无处不在的AI网络,以提升用户体验和强化在AI时代的核心竞争力。

【AiBase提要:】

🚀 阿里成立千问C端事业群,整合夸克、UC等核心应用

📱 旨在打造AI时代的超级APP,成为用户数字生活的第一入口

🌐 拓展至眼镜、PC、汽车等多终端场景,构建无处不在的AI网络

8、微软 Excel 网页版全新 “智能体模式” 上线,AI 助力高效数据处理

微软推出网页版 Excel 的“智能体模式”,使 AI 能够深入参与复杂的数据处理任务,提升效率并增强透明度。

image.png

【AiBase提要:】

🧠 智能体模式让 Excel 成为更智能的数字助手,提升数据处理效率。

📊 AI 可以自主处理复杂工作流程,并实时更新表格数据。

🔍 提供 AI 透明度,用户可审查 AI 的决策过程和推理逻辑。