相关推荐
谷歌新语音克隆技术:仅需几秒钟音频样本,即可实现声音克隆
在科技迅猛发展的今天,语音合成技术也在进步,尤其恢复失去声音领域。最近,谷歌研究人员们提出了一种名为 “零样本语音转换(zero-shot voice transfer)” 的新技术项技术可以直接与最先进的文本语音(TTS)系统相结合,帮助那些因疾病事故失去声音的人,找回他们的 “声音记忆。这项技术的核心在于 “零样本” 能力,意味着我们不需要大量样本就能实现语音转换。也就是说,仅需几秒钟的参考音频,即可实现声音克隆,且支持合成跨语言的音频。“零样本” 克隆声音能力研究团队
百度AI代码助手文心快码升级:推出企业级代码架构解释等功能
在2024年9月25日举行的百度云智大会上,百度智能云宣布了一系列针对企业AI应用的重大升级,旨在帮助企业更高效、更经济地利用大模型。此次升级包括百舸AI异构计算平台4.0和千帆大模型平台3.0,以及对代码助手、智能客服和数字人等AI原生应用产品的全面更新。
Snapchat与谷歌合作,My AI 聊天机器人引入Gemini多模态能力
Snapchat 最近宣布与谷歌云达成了一项扩大合作关系,这次合作的重点是为 Snapchat 的 My AI 聊天机器人注入更强大的生成式人工智能功能。通过这次合作,My AI 将能够利用谷歌的 Gemini AI 的多模态能力,理解和处理各种信息,包括文本、音频、图片和视频。在 Snap 的年度合作伙伴峰会上,Snapchat 展示了基于 Gemini 的类似 Google Lens 的新功能。用户现在可以通过 My AI 请求翻译外国街头标志的照片,或者请聊天机器人帮忙从菜单中挑选出最健康的食物。这种功能的加入,无疑让 Snapchat 的互动体验更
Spotify 的 AI 播放列表功能现已在美国等多个国家上线
最近,Spotify 在美国、加拿大、爱尔兰和新西兰等地推出了它的新AI播放列表功能。这一功能最初在英国和澳大利亚的 Premium 用户中上线,反响热烈,现已扩展至更多地区。使用这个功能非常简单,用户只需在应用内输入一些文字提示,比如 “适合在家约会的浪漫播放列表”,然后就能得到一份定制的歌曲推荐,完全符合你想要的氛围和心情。这款功能目前在安卓和 iOS 设备上处于测试阶段,用户体验也在不断优化。用户可以通过更多的提示来进一步完善播放列表。Spotify 甚至会给出一些建
智源研究院发布中文互联网语料库CCI3.0 包含1000GB数据集
在2024北京文化论坛上,北京智源人工智能研究院(BAAI)宣布正式发布新一代中文互联网语料库CCI3.0(Chinese Corpora Internet),进一步推动数据共建共享。CCI3.0包含1000GB的数据集及498GB的高质量子集CCI3.0-HQ,是继2023年11月首次开源CCI1.0和2024年4月发布CCI2.0之后的又一次重要更新。
