西湖心辰宣佈開源其研發的Westlake-Omni模型。作爲全球首個開源的中文情感端到端語音交互大模型,Westlake-Omni採用了離散表示法來統一文本和語音模態,特別注重實時性,能夠快速響應並提供幾乎零延遲的體驗。

該模型具備出色的情感理解與表達能力,能夠生成清晰、自然、富有表現力的中文語音。這種能力得益於其在高質量中文情感語音數據集上的深度訓練,使得模型不僅能夠理解中文語境下的複雜情感,還能使交互更加人性化。

微信截圖_20240926081503.png

西湖心辰期望通過開源Westlake-Omni模型,鼓勵更多開發者參與到中文情感語音交互技術的開發中,共同推動該領域技術的發展和應用。

項目地址:https://github.com/xinchen-ai/Westlake-Omni