華爲發佈昇騰大模型：無GPU訓練高數大題僅需2秒！

最近，華爲通過其新推出的 “昇騰 + Pangu Ultra MoE” 系統展示了一個令人驚歎的突破:一個近萬億參數的 MoE 大模型在短短2秒內就能理解並解答一道高等數學題。而這一切都在沒有使用 GPU 的情況下實現，顯示出華爲在自主可控的國產算力和模型訓練方面的強大能力。

在技術層面，華爲的團隊成功提升了訓練系統的整體性能，通過智能選擇並行策略和優化計算通信，大幅提高了集羣的訓練效率。在其技術報告中，華爲詳盡披露了在 CloudMatrix384超節點上進行的多項技術創新，包括改進的通信機制和負載均衡策略。這些創新使得大規模 MoE 訓練的專家並行通信開銷幾乎降至零，同時有效平衡了計算負載。

此外，華爲在提高單節點算力方面也取得了顯著成效。他們通過優化訓練算子的執行，成功將微批處理規模提升至原來的兩倍，同時解決了算子下發的效率問題。這種技術的進步意味着，華爲的系統在面對複雜計算任務時，能夠更加高效地利用現有資源。

華爲的這一系列技術創新不僅讓 MoE 模型的訓練效率大幅提升，更爲未來大規模 AI 模型的訓練與應用打開了新的可能性。

1Gbps 峯值紀錄被刷新！華爲聯手電信發佈 5G-A 大上行技術：京滬高鐵已試點，滿意度破 98%

華爲與中國電信在2026年MWC上聯合展示5G-A無線大上行技術，旨在解決傳統網絡上傳慢、信號弱、速率不穩等問題，爲高清直播、大數據回傳及AI雲端交互提供支持。在安徽測試中，華爲2.1G 8T設備上行峯值速率突破1Gbps，並確保全場20Mbps穩定速率。

DeepSeek V4下週發佈:原生支持影音圖文生成，適配國產算力

深度求索將於下週發佈多模態大模型V4，原生支持圖像、視頻與文本生成，旨在填補國內高性能低成本開源多模態模型市場空白。這是繼1月發佈R1推理模型後的首次重大更新。發佈初期將提供簡要技術說明，一個月後公開詳細工程報告。V4模型已與華爲、寒武紀完成底層生態合作。

DeepSeek V4 發佈在即！全新多模態模型讓 AI 生成更智能

深度求索將於下週推出多模態大模型DeepSeek V4，原生支持圖像、視頻和文本生成。這是繼今年1月發佈R1推理模型後的首次重大更新，旨在滿足國內對低成本開源模型的需求，推動AI發展。同時將發佈簡要技術說明，詳細版本預計一個月後推出。

華爲發佈昇騰大模型：無GPU訓練高數大題僅需2秒！

相關推薦

華爲 Sound X 5 官宣預售：AI 大模型賦能音頻新體驗

1Gbps 峯值紀錄被刷新！華爲聯手電信發佈 5G-A 大上行技術：京滬高鐵已試點，滿意度破 98%

華爲全新AI眼鏡曝光：支持拍攝與同聲傳譯，預計 4 月與Pura90 同步登場

DeepSeek V4下週發佈:原生支持影音圖文生成，適配國產算力

DeepSeek V4 發佈在即！全新多模態模型讓 AI 生成更智能