近日,摩爾線程公司宣佈正式開源其研發的音頻理解大模型——MooER(摩耳),這一業界首個基於國產全功能GPU進行訓練和推理的大型開源語音模型,展示了摩爾線程在人工智能領域的最新成果。

MooER大模型在摩爾線程誇娥(KUAE)智算平臺上,僅用38小時便完成了5000小時音頻數據和僞標籤的訓練。這一成就得益於公司自研的創新算法和高效計算資源的結合。MooER不僅支持中文和英文的語音識別,還具備中譯英的語音翻譯能力,在多個語音識別領域的測試集中展現出優異表現。特別在Covost2中譯英測試集中,MooER-5K取得了25.2的BLEU分數,接近工業級效果。

微信截圖_20240826083635.png

摩爾線程AI團隊開源了推理代碼和5000小時數據訓練的模型,並計劃進一步開源訓練代碼和基於8萬小時數據訓練的模型。MooER的模型結構包括Encoder、Adapter和Decoder三個部分,使用開源的Paraformer語音編碼器、Qwen2-7B-instruct大語言模型來初始化Encoder和LLM模塊。

在技術對比中,MooER-5K在中文和英文測試集上的表現均優於其他開源模型。摩爾線程通過這一開源項目,爲數據資源和計算資源有限的開發者提供了寶貴的參考和支持。

GitHub:https://github.com/MooreThreads/MooER