相關推薦
英偉達收購 SchedMD 加強開源 AI 生態系統佈局
英偉達收購AI軟件公司SchedMD,強化開源技術佈局,提升AI生態競爭力。公司以高速芯片聞名,同時積極提供多種開源AI模型,覆蓋物理模擬、自動駕駛等領域,推動技術普及與創新。
Dec 16, 2025
100.2k
智譜多模態開源周圓滿落幕:四項視頻生成核心技術全面開放
智譜團隊開源四項視頻生成核心技術,包括GLM-4.6V視覺理解、AutoGLM設備控制、GLM-ASR語音識別和GLM-TTS語音合成模型,展示其在多模態領域的最新進展,爲視頻生成技術發展奠定基礎。
Dec 12, 2025
186.3k
Qwen3-TTS 升級:多樣化聲音讓語音合成更自然
Qwen3-TTS語音合成模型全面升級,支持多音色、多語種和多方言,顯著提升語音自然度和穩定性。通過Qwen API可便捷訪問,現提供超過49種高品質音色,覆蓋不同性別、年齡和地域特徵,滿足多樣化場景需求。
Dec 11, 2025
150.8k
“開口即角色”!阿里 Qwen3-TTS 登場:49 種音色 + 10 語言 9 方言,WER 碾壓主流商用模型
阿里巴巴發佈Qwen3-TTS語音合成模型,具備零樣本、多角色、跨語言能力,在詞錯誤率上優於主流商用引擎。提供49種音色,覆蓋多種場景,支持10種語言及9種中國方言。開發者可在阿里雲免費調用100萬字符額度。
Dec 8, 2025
239.8k
面壁智能推出 VoxCPM:新一代高擬真語音生成模型
在語音合成技術快速發展的背景下,面壁智能與清華大學深圳國際研究生院人機語音交互實驗室(THUHCSI)近日聯合發佈了一款新型語音生成模型 ——VoxCPM。這款模型以0.5B 的參數尺寸,致力於爲用戶提供高質量、自然的語音合成體驗。VoxCPM 的推出標誌着高擬真語音生成領域的又一里程碑。該模型在自然度、音色相似度及韻律表現力等關鍵指標上,均達到了行業領先水平。通過零樣本聲音克隆技術,VoxCPM 能夠以極少的數據,生成用戶獨特的聲音,從而實現個性化的語音合成。這一技術進步
Sep 19, 2025
143.3k
