近日,Soul AI Lab 宣佈正式開源業內首個擁有14億參數的實時數字人生成模型 ——SoulXFlashTalk。這個模型的特別之處在於,它能夠實現亞秒級延遲和每秒32幀的高幀率,爲行業提供了一套完整的實時交互解決方案。

SoulXFlashTalk 的開源意味着開發者將可以輕鬆訪問相關的項目頁面、技術報告、源代碼和模型權重,形成一個全面開放的體系。這一舉措不僅能有效降低行業內的研發門檻,也將爲更多的創新項目提供基礎支持。值得一提的是,早在去年10月,Soul 便已經開源了語音合成模型 SoulXPodcast,此次的開源標誌着 Soul 在 “語音 + 視覺” 雙模態開源矩陣的佈局上又邁出了重要一步。

image.png

Soul 的開源戰略並不僅限於技術的共享,更是希望通過開放的方式,促進 AI 生態的共同發展。公司表示,未來將繼續堅持開源路線,開放更多 AI 技術成果,從而推動 AI 與社交領域的創新與融合。

隨着 Soul 在多模態 AI 生態佈局的不斷完善,業內專家預測,這將爲社交網絡、在線教育、虛擬現實等多個行業帶來顛覆性的變化。可以預見,Soul 的努力將爲未來的數字交互體驗設定新的標杆,讓我們拭目以待。

劃重點:

🌟 Soul AI Lab 推出14B 參數的實時數字人生成模型 SoulXFlashTalk,具備快速響應能力和高幀率。  

🚀 開源帶來項目頁面、技術報告、源代碼及模型權重,降低研發門檻,鼓勵更多創新。  

🤝 Soul 將繼續推進開源戰略,推動 AI 與社交創新發展,構建多模態 AI 生態。