法國開源AI研究實驗室Kyutai發佈了一款全新的多模態大模型Moshi。這不僅僅是一個技術突破,更是對現有AI技術的一次大膽挑戰。

7月4日凌晨,Kyutai在官網宣佈了Moshi的到來。這款模型的功能與OpenAI在5月展示的GPT-4o相當,能夠聽取人的語音提問並實時進行推理回答。但與GPT-4o的語音模式要等到秋天才能全面開放不同,Moshi已經可以被大家使用。

主要特點:

  • 多模態能力:Moshi可以聽取人的語音提問後進行實時推理回答,而且它的語音模式已經開放,比GPT-4o的秋天上線要快得多。

  • 無區域限制:無論你身在何處,都能使用Moshi。

  • 手機移動端支持:雖然對普通話支持不太好,但用英語提問完全沒問題。

  • 即將開源:Kyutai計劃很快開源Moshi,屆時將公佈代碼、模型權重和論文。

QQ截圖20240704095539.jpg

體驗地址:https://top.aibase.com/tool/moshi-chat

Moshi的發佈,無疑是對AI技術的一次大膽嘗試。它不僅具備聽、說的能力,未來還可能展示出看的能力。這讓我們對AI的未來充滿了期待。而且,Moshi的使用過程非常簡單,只需登錄官網,填寫郵箱地址,點擊加入,就能開始與Moshi進行對話。

官方演示視頻

值得一提的是,Moshi對普通話的支持還有待提高,使用英語提問會得到更好的體驗。此外,Moshi不鎖區,無論身在何處,都能直接使用,這無疑爲全球的AI愛好者提供了極大的便利。

官方演示

Kyutai實驗室的這一舉措,也顯示出了他們對開源精神的堅持。他們計劃很快開源Moshi,公佈代碼、模型權重和論文,讓全球的開發者和研究者都能參與到Moshi的開發和優化中來。

使用感受

  • 響應速度快:即使是在國區線路上使用,Moshi也能幾乎無延遲地響應提問。

  • 語言支持:目前Moshi主要支持英語和法語,中文普通話支持有待提高。

  • 使用便捷:註冊流程簡單,只需提交郵箱即可。

  • 能力展示:Moshi展示了聽和說的能力,未來可能還會增加看的能力。Moshi的擬人化語氣是其一大特點,機器味很少,這讓對話體驗更加自然流暢。

當然,Moshi目前的回答內容還比較有限,只能提供大致的輪廓和概要。但隨着產品的不斷迭代和優化,我們相信Moshi的回答將變得更加詳盡和準確。

此外,Moshi的發佈對教育行業也將產生深遠的影響。例如,AI可以爲學生提供循環講解,這對於教育幫助是巨大的。我們期待未來能有更多類似的產品出現,支持更多地方語言,讓AI技術更加貼近人們的生活。