正文

崑崙元 AI 推出全新全模態融合模型 BaiZe-Omni-14b-a2b，推動 AI 技術新進展

發布於AI新閒資訊

時間 :Nov 25, 2025

閱讀 :1分鐘

在2025世界計算大會上，崑崙元 AI 正式發佈了基於昇騰（Ascend）平臺的全模態融合模型 BaiZe-Omni-14b-a2b。這一新模型具備強大的文本、音頻、圖像和視頻理解與生成能力，採用了創新的技術架構，包括模態解耦編碼、統一跨模態融合和雙分支功能設計，旨在推動多模態應用的發展。

BaiZe-Omni-14b-a2b 的設計流程清晰，涵蓋輸入處理、模態適配、跨模態融合、核心功能和輸出解碼等步驟。爲了優化計算效率，該模型在 MoE+TransformerX 架構中引入了多線性注意力層和單層混合注意力聚合層，確保了大規模全模態應用的順利實施。此外，模型的雙分支設計使其在理解和生成能力上均有顯著優勢，能夠有效處理多達10類任務並具備強大的多模態內容生成能力。

在模型的訓練過程中，崑崙元 AI 使用了豐富的高質量數據。訓練數據涵蓋了超過3.57萬億 token 的文本數據、30萬小時以上的音頻數據、4億張圖像和超過40萬小時的視頻數據，確保了單模態數據的純度和跨模態數據的對齊質量。通過差異化的數據配比，模型在不同訓練階段均能實現性能的逐步提升。

在性能方面，BaiZe-Omni-14b-a2b 在多模態理解的核心指標上表現出色，文本理解準確率達到89.3%。在長序列處理場景中，該模型的32768token 文本摘要任務的 ROUGE-L 得分爲0.521，顯著高於行業主流模型 GPT-4的0.487。此外，該模型還支持多語言文本生成和圖像、音頻及視頻的多模態生成，顯示出其強大的綜合能力。

劃重點:
🌐 ** 全模態能力 **:BaiZe-Omni-14b-a2b 具備強大的文本、音頻、圖像和視頻理解與生成能力。
📈 ** 性能突出 **:模型在文本理解和長序列處理上表現優異，ROUGE-L 得分顯著領先同類模型。
💡 ** 多領域應用 **:該模型將爲智能客服、內容創作等多個領域提供技術支持，推動 AI 技術進步。

上海 AI 實驗室發佈 XTuner V1 訓練引擎大模型訓練效率暴漲20%

上海AI實驗室開源XTuner V1大模型訓練引擎，針對AI訓練效率瓶頸問題，採用創新技術提升訓練效率和性能，實現技術飛躍。

Sep 9, 2025

180.7k

華爲發佈盤古大模型5.5：五大基礎模型升級深度思考模型將上線

在今日下午舉行的華爲開發者大會HDC2025主題演講中，華爲常務董事、華爲雲計算CEO張平安宣佈正式發佈盤古大模型5.5，標誌着自然語言處理（NLP）、計算機視覺(CV)、多模態、預測、科學計算五大基礎模型迎來全面升級。

Jun 20, 2025

269.9k

華爲發佈昇騰大模型：無GPU訓練高數大題僅需2秒！

最近，華爲通過其新推出的 “昇騰 + Pangu Ultra MoE” 系統展示了一個令人驚歎的突破:一個近萬億參數的 MoE 大模型在短短2秒內就能理解並解答一道高等數學題。而這一切都在沒有使用 GPU 的情況下實現，顯示出華爲在自主可控的國產算力和模型訓練方面的強大能力。在技術層面，華爲的團隊成功提升了訓練系統的整體性能，通過智能選擇並行策略和優化計算通信，大幅提高了集羣的訓練效率。在其技術報告中，華爲詳盡披露了在 CloudMatrix384超節點上進行的多項技術創新，包括改進的通信機

May 30, 2025

438.5k