相关推荐
英伟达收购 SchedMD 加强开源 AI 生态系统布局
英伟达收购AI软件公司SchedMD,强化开源技术布局,提升AI生态竞争力。公司以高速芯片闻名,同时积极提供多种开源AI模型,覆盖物理模拟、自动驾驶等领域,推动技术普及与创新。
2025年12月16号 8:54
99.2k
智谱多模态开源周圆满落幕:四项视频生成核心技术全面开放
智谱团队开源四项视频生成核心技术,包括GLM-4.6V视觉理解、AutoGLM设备控制、GLM-ASR语音识别和GLM-TTS语音合成模型,展示其在多模态领域的最新进展,为视频生成技术发展奠定基础。
2025年12月12号 10:44
184.4k
Qwen3-TTS 升级:多样化声音让语音合成更自然
Qwen3-TTS语音合成模型全面升级,支持多音色、多语种和多方言,显著提升语音自然度和稳定性。通过Qwen API可便捷访问,现提供超过49种高品质音色,覆盖不同性别、年龄和地域特征,满足多样化场景需求。
2025年12月11号 9:17
163.9k
“开口即角色”!阿里 Qwen3-TTS 登场:49 种音色 + 10 语言 9 方言,WER 碾压主流商用模型
阿里巴巴发布Qwen3-TTS语音合成模型,具备零样本、多角色、跨语言能力,在词错误率上优于主流商用引擎。提供49种音色,覆盖多种场景,支持10种语言及9种中国方言。开发者可在阿里云免费调用100万字符额度。
2025年12月8号 13:57
222.1k
面壁智能推出 VoxCPM:新一代高拟真语音生成模型
在语音合成技术快速发展的背景下,面壁智能与清华大学深圳国际研究生院人机语音交互实验室(THUHCSI)近日联合发布了一款新型语音生成模型 ——VoxCPM。这款模型以0.5B 的参数尺寸,致力于为用户提供高质量、自然的语音合成体验。VoxCPM 的推出标志着高拟真语音生成领域的又一里程碑。该模型在自然度、音色相似度及韵律表现力等关键指标上,均达到了行业领先水平。通过零样本声音克隆技术,VoxCPM 能够以极少的数据,生成用户独特的声音,从而实现个性化的语音合成。这一技术进步
2025年9月19号 10:32
158.2k
