摩爾線程開源音頻理解大模型MooER摩耳

近日，摩爾線程公司宣佈正式開源其研發的音頻理解大模型——MooER（摩耳），這一業界首個基於國產全功能GPU進行訓練和推理的大型開源語音模型，展示了摩爾線程在人工智能領域的最新成果。

MooER大模型在摩爾線程誇娥（KUAE）智算平臺上，僅用38小時便完成了5000小時音頻數據和僞標籤的訓練。這一成就得益於公司自研的創新算法和高效計算資源的結合。MooER不僅支持中文和英文的語音識別，還具備中譯英的語音翻譯能力，在多個語音識別領域的測試集中展現出優異表現。特別在Covost2中譯英測試集中，MooER-5K取得了25.2的BLEU分數，接近工業級效果。

微信截圖_20240826083635.png

摩爾線程AI團隊開源了推理代碼和5000小時數據訓練的模型，並計劃進一步開源訓練代碼和基於8萬小時數據訓練的模型。MooER的模型結構包括Encoder、Adapter和Decoder三個部分，使用開源的Paraformer語音編碼器、Qwen2-7B-instruct大語言模型來初始化Encoder和LLM模塊。

在技術對比中，MooER-5K在中文和英文測試集上的表現均優於其他開源模型。摩爾線程通過這一開源項目，爲數據資源和計算資源有限的開發者提供了寶貴的參考和支持。

GitHub:https://github.com/MooreThreads/MooER

國產GPU新突破：摩爾線程S5000 助力中國移動“九天”大模型

在第九屆數字中國建設峯會上，中國移動將首次公開展示其自研的“九天”35B通用大模型。摩爾線程宣佈，其旗艦GPU MTT S5000已完成對該模型的全流程適配與推理驗證，這標誌着國產算力生態的重要突破。通過自研MUSA軟件棧和SGLang-MUSA高性能推理引擎，摩爾線程實現了“九天”35B模型推理全鏈路的深度融合與優化。

國產算力底座再突破！摩爾線程 MTT S5000 完成智譜 GLM-5 大模型全流程適配

國產AI硬件與軟件協同發展取得新突破。摩爾線程MTT S5000 GPU已完成對智譜GLM-5大模型的全流程適配，實現國產算力與大模型的深度結合。該GPU基於自研“平湖”架構，專爲大模型訓練與推理設計，標誌着國產AI生態自主化進程的關鍵一步。

國產算力新突破！摩爾線程×硅基流動在MTT S5000上實現DeepSeek V3 671B滿血版高效推理，單卡性能逼近國際頂尖水平

國產AI芯片與大模型協同優化取得重要進展。摩爾線程與硅基流動基於國產GPU MTT S5000，成功完成對千億參數大模型DeepSeek V3 671B的深度適配。通過應用FP8低精度推理技術，實現單卡預填充吞吐量超4000 tokens/秒，解碼吞吐量超1000 tokens/秒，推理速度已接近國際主流高端AI加速器水平。

摩爾線程開源音頻理解大模型MooER摩耳

相關推薦

國產GPU新突破：摩爾線程S5000 助力中國移動“九天”大模型

國產算力底座再突破！摩爾線程 MTT S5000 完成智譜 GLM-5 大模型全流程適配

摩爾線程發佈國產 AI 編程服務:軟硬協同助推開發生態變革

國產算力新突破！摩爾線程×硅基流動在MTT S5000上實現DeepSeek V3 671B滿血版高效推理，單卡性能逼近國際頂尖水平

2025胡潤中國AI 50強出爐，寒武紀6300億獨佔鰲頭