相關推薦
小米發佈全鏈路語音大模型 MiMo-V2.5,TTS 可“一句話生成新音色”,ASR 開源支持方言與多語混說
小米發佈MiMo-V2.5全鏈路語音模型系列,包括三款TTS模型和一款開源ASR模型,覆蓋語音輸入與輸出。TTS模型能精準調度情緒、語氣和角色身份,讓聲音可編程、可創作、可復刻,提升人機交互自然度,開啓語音智能新紀元。
Apr 24, 2026
266.9k
英偉達收購 SchedMD 加強開源 AI 生態系統佈局
英偉達收購AI軟件公司SchedMD,強化開源技術佈局,提升AI生態競爭力。公司以高速芯片聞名,同時積極提供多種開源AI模型,覆蓋物理模擬、自動駕駛等領域,推動技術普及與創新。
Dec 16, 2025
157.4k
智譜多模態開源周圓滿落幕:四項視頻生成核心技術全面開放
智譜團隊開源四項視頻生成核心技術,包括GLM-4.6V視覺理解、AutoGLM設備控制、GLM-ASR語音識別和GLM-TTS語音合成模型,展示其在多模態領域的最新進展,爲視頻生成技術發展奠定基礎。
Dec 12, 2025
215.4k
Qwen3-TTS 升級:多樣化聲音讓語音合成更自然
Qwen3-TTS語音合成模型全面升級,支持多音色、多語種和多方言,顯著提升語音自然度和穩定性。通過Qwen API可便捷訪問,現提供超過49種高品質音色,覆蓋不同性別、年齡和地域特徵,滿足多樣化場景需求。
Dec 11, 2025
203.2k
“開口即角色”!阿里 Qwen3-TTS 登場:49 種音色 + 10 語言 9 方言,WER 碾壓主流商用模型
阿里巴巴發佈Qwen3-TTS語音合成模型,具備零樣本、多角色、跨語言能力,在詞錯誤率上優於主流商用引擎。提供49種音色,覆蓋多種場景,支持10種語言及9種中國方言。開發者可在阿里雲免費調用100萬字符額度。
Dec 8, 2025
338.2k
