欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、Google Gemini 应用重磅更新:用户可轻松检测视频是否由 Google AI 生成

Google 推出 Gemini 应用新功能,用户可上传视频并检测其是否由 Google AI 生成,提升 AI 内容透明度和可信度。

image.png

【AiBase提要:】

🎥 SynthID 水印检测全面升级,可识别视频中 AI 生成内容。

🔍 用户可通过 Gemini 应用上传视频并查询是否由 Google AI 生成。

🌐 功能覆盖全球,无需额外订阅或工具。

详情链接:https://blog.google/technology/ai/verify-google-ai-videos-gemini-app/

2、GPT-5.2-Codex 正式亮相:以“上下文压缩”攻克长程编码难题

GPT-5.2-Codex 的发布标志着智能代编码领域的重大突破,其在代码重构、系统迁移以及网络安全防御方面表现出卓越性能,同时通过严格的访问控制策略保障技术安全。

【AiBase提要:】

🧠 GPT-5.2-Codex 通过上下文压缩技术提升长程任务执行能力。

🛡️ 在网络安全领域展现出专业级的夺旗赛(CTF)实战水平。

🔒 采取多层次部署策略,确保技术普惠与安全合规并重。

3、美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar

美团LongCat团队推出SOTA级虚拟人视频生成模型LongCat-Video-Avatar,该模型在长视频生成领域表现优异,具有多项核心功能,吸引了广泛开发者关注。


image.png

【AiBase提要:】

🎥 LongCat-Video-Avatar 是美团LongCat团队推出的视频生成模型,支持多任务功能。

🧠 采用Cross-Chunk Latent Stitching训练策略,提升长视频生成质量。

📊 在多个数据集上达到SOTA水平,展现强大应用潜力。

详情链接:https://github.com/meituan-longcat/LongCat-Video

4、苹果发布全新多模态 AI 模型 UniGen 1.5,实现图像理解、生成与编辑三合一

苹果最新推出的多模态AI模型UniGen1.5在图像处理领域实现了重要突破,其集成图像理解、生成和编辑功能,显著提升了工作效率。通过“编辑指令对齐”技术,模型能够更准确地捕捉用户意图,提高图像编辑的准确性。在多项行业标准测试中,UniGen1.5表现出色,展现了强大的竞争力。


image.png

【AiBase提要:】

🧠 UniGen1.5集成了图像理解、生成和编辑功能,提升了工作效率。

🛠️ 引入“编辑指令对齐”技术,提高了图像编辑的准确性。

📊 在多项测试中表现优异,显示出强大的竞争力。

详情链接:https://arxiv.org/abs/2511.14760

5、ElevenLabs打通WhatsApp!AI语音助理可接打电话、批量外呼,客服革命正式落地

ElevenLabs在2025年12月18日宣布其AI语音智能体(Agents)深度集成WhatsApp,实现了文字+语音双模全渠道交互。这一更新不仅提升了企业的客服效率,还降低了部署成本,显著提高了客户满意度和转化效率。

【AiBase提要:】

✅ 自然接听来电:用户拨打企业WhatsApp号码,AI即以高度拟人化语音应答

✅ 主动外呼服务:支持单次或批量外呼,适用于预约提醒、催收通知、客户回访等高频场景

✅ 实时语音交互:无论用户发送语音消息,还是AI主动拨打电话,均实现低延迟、高自然度的流畅对话

详情链接:https://elevenlabs.io/docs/agents-platform/whatsapp

6、字节跳动 AI 手机合作方案曝光,免收 Token 分成开启“让利换入口”

字节跳动正积极与多家头部硬件厂商展开 AI 手机合作,通过预装 AIGC 插件获取 AI 流量入口,并提供让利策略吸引厂商参与,以提升自身在 AI 领域的竞争力。

【AiBase提要:】

📱 字节跳动与 vivo、联想、传音等厂商合作,预装 AIGC 插件以获取 AI 流量入口。

💰 采用免收定制开发费与 Token 销售分成的策略,吸引手机厂商参与流量分发和收益分成。

🤝 此次合作旨在打破手机厂商对第三方 AI 的戒备,提升 AI 竞争力。

7、Claude AI 新 “任务模式” 上线:智能助手全新进化,能提问会执行!

Claude AI 的新任务模式通过创新的双面板设计、结构化行动计划以及自动化技能集成,显著提升了智能助手在复杂任务中的表现和用户体验。

【AiBase提要:】

🧠 Claude 任务模式引入双面板布局,提升任务执行效率。

📝 支持生成结构化行动计划和澄清性提问,确保任务准确性。

🛠️ 集成多种技能和模型上下文协议,实现自动化任务处理。

8、Luma发布Ray3 Modify:AI视频编辑新突破,保留演员表演细节,一键换装、换场景

Luma AI发布Ray3Modify,实现了对实拍视频的高保真AI修改,保留演员表演细节的同时支持换装、换场景,为影视、广告、游戏等行业带来新的创作可能性。


image.png

【AiBase提要:】

🎬 通过角色参考图和关键帧实现精准编辑

🔄 保留演员表演细节,支持换装、换场景

💰 获得9亿美元融资,计划建设AI算力集群

9、QQ音乐推本地化AI作曲:酷睿Ultra加持,几分钟生成完整歌曲,创作隐私不外泄

QQ音乐推出的本地化AI作曲功能,通过酷睿Ultra处理器实现完全本地化的大模型音乐生成,极大降低了创作门槛并保障了隐私安全。

【AiBase提要:】

🎧 QQ音乐推出本地化AI作曲功能,用户无需联网即可创作原创歌曲。

🔒 采用本地推理路径,保障创作隐私,数据不上传服务器。

🧠 酷睿Ultra处理器内置NPU,提升AI计算效率并延长电池续航。

10、微信元宝 AI 助手增加新功能,轻松一句话设置提醒

微信元宝 AI 助手新增了通过一句话设置提醒的功能,让用户能够更便捷地管理日程和待办事项。同时,它还具备解析公众号文章、图片及文档内容的能力,并支持语音交互,降低了使用门槛,适合各类用户群体。


image.png

【AiBase提要:】

📅 元宝 AI 助手支持用户通过一句话轻松设置提醒,提升了日程管理的便捷性。

🗣️ 用户可以通过语音消息与元宝互动,方便长辈用户使用。

📱 元宝不仅限于提醒功能,还提供文章解析、图文识别等多种实用功能。