欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、腾讯元宝推出新功能:一句话或一张图即可生成视频!

腾讯元宝推出了一个创新功能,允许用户通过一句话或一张图片生成视频,基于腾讯混元团队最新开源的HunyuanVideo1.5模型。该模型采用Diffusion Transformer(DiT)架构,拥有8.3亿个参数,支持生成5至10秒的高清视频。这一功能不仅为普通用户提供了便捷的创作工具,也为内容创作者带来了新的灵感来源,进一步增强了社交媒体内容的丰富性。

image.png

【AiBase提要:】

🎥 腾讯元宝推出新功能,让用户通过一句话或一张图生成视频。

🚀 HunyuanVideo1.5模型支持生成5至10秒的高清视频,使用简单。

💡 新功能为用户提供了更多创作灵感,助力内容丰富化。

2、谷歌推出Nano Banana Pro:基于Gemini 3,支持4K、联网搜索与C2PA验证

谷歌推出Nano Banana Pro,基于Gemini 3模型,支持4K分辨率、14对象融合、5人身份一致性保持,并新增联网搜索与C2PA验证功能。定价上调,功能亮点包括专业控制、联网生成和双重水印,开发者可通过多种方式接入。

image.png

【AiBase提要:】

📷 专业控制:用户可在提示词中指定机位、景深、焦点、光效与色彩分级,默认提供6张高保真成片供挑选。

🌐 联网生成:模型可实时搜索网络,自动抓取食谱、资讯或股价并生成对应信息图,已在NotebookLM、Flow、Slides与Vids中集成。

🔒 双重水印:SynthID隐形水印+C2PA内容凭证同时写入,用户上传图片即可在Gemini App验证是否由谷歌模型生成或修改。

3、夸克AI眼镜与高德合作加码,陆续接入扫街榜、打车等出行服务

夸克AI眼镜与高德深化合作,推出多项新功能,如导航投屏、方向指引随头转动等,提升用户出行体验。

image.png

【AiBase提要:】

🚀 夸克AI眼镜新增导航投屏功能,实现手机与眼镜无缝连接。

🧭 导航方向随头部转动调整,提升步行和骑行时的便捷性与安全性。

🍽️ 支持周边搜索及打车行程提醒,优化城市探索体验。

4、豆包输入法低调现身小米商店,主打智能语音交互

豆包输入法作为豆包生态的新成员,搭载了与豆包App同源的语音输入技术,支持多种语言和输入方式,同时具备智能联想功能,旨在提升用户的输入效率。

【AiBase提要:】

🎙️ 支持多种方言、纯英文及中英混合输入,优化了“轻声说话”功能。

⌨️ 提供经典9键与26键布局,并内置剪贴板、常用语及即时翻译等实用工具。

🧠 智能联想功能覆盖文字、标点符号、Emoji、数学公式及日期等多个维度,提升输入效率。

5、月之暗面计划明年下半年上市,估值或达 40 亿美元

月之暗面计划于明年下半年进行首次公开募股(IPO),融资完成后公司估值可能达到约40亿美元。该项目致力于探索月球资源及其在地球的应用,吸引了众多科技爱好者和投资者的关注。

【AiBase提要:】

🌕 月之暗面计划于明年下半年进行首次公开募股(IPO)

💰 融资完成后,公司估值可能达到约40亿美元

🚀 月之暗面致力于探索月球资源及其在地球的应用

6、MOSS-Speech开源:国内首个语音到语音大模型,告别文本中介

MOSS-Speech是复旦大学MOSS团队推出的国内首个端到端语音到语音对话模型,无需依赖ASR→LLM→TTS流水线,具备语音问答、情绪模仿与笑声生成能力。其在多项评测中表现优异,且已开源代码和权重,支持商用许可。

image.png

【AiBase提要:】

🚀 MOSS-Speech实现端到端语音到语音对话,无需文本中介。

📊 在ZeroSpeech2025任务中WER降至4.1%,情感识别准确率91.2%。

📦 提供48kHz超采样版与16kHz轻量版,支持实时推理与本地私有声音克隆。

7、ChatGPT 群聊功能正式上线:最多可容纳 20 人,AI 参与头脑风暴

ChatGPT 的群聊功能正式上线,支持最多20人同时在线,并允许 AI 参与讨论。用户可以通过生成分享链接邀请他人加入,增强了团队协作能力。同时,OpenAI 强调了隐私保护,确保群聊创建者的个人数据不会被共享。

image.png

【AiBase提要:】

🤖 ChatGPT 群聊功能现已全面上线,支持最多20人同时参与。

🌟 用户可通过分享链接轻松邀请他人加入群聊,增强团队协作。

🔒 群聊创建者的个人数据安全得到了保护,AI 可以在对话中灵活参与。

8、谷歌NotebookLM重磅更新:AI一键生成专业PPT,配图惊艳碾压Gemini App!

谷歌NotebookLM的升级版引入了Slide Decks功能,能够将用户上传的资料转化为专业级演示文稿,同时配图由Nano Banana Pro模型驱动,确保视觉效果高质量。此外,支持自定义提示词,提升用户体验。

image.png

【AiBase提要:】

🖼️ 新增Slide Decks功能,可将资料一键生成专业PPT。

🎨 配图由Nano Banana Pro模型驱动,视觉效果惊艳。

⚙️ 支持自定义提示词,实现深度定制化生成。