正文

打破手機跑大模型壁壘，面壁智能聯合清華開源端側新品BitCPM-CANN

aibase

發布於AI新閒資訊

時間 :May 26, 2026

閱讀 :1分鐘

面壁智能近日聯合清華大學、OpenBMB開源社區，正式發佈並開源了在低比特大模型訓練方向的最新突破成果——BitCPM-CANN。該成果在華爲昇騰平臺上原生完成，標誌着端側AI大模型在輕量化與工程落地方面邁出了關鍵一步。

釋放六倍顯存紅利打破硬件限制

本次開源的BitCPM-CANN包含0.5B、1B、3B、8B四個模型尺寸，與同尺寸全精度家族模型進行逐項對照評測，表現十分優異。相比傳統BF16 精度，該模型在推理階段能夠釋放約 6 倍的顯存紅利，讓大模型運行的硬件門檻大幅降低。

對於手機產業而言， 6 倍的顯存紅利意味着原本對配置要求極高的8B參數級別大模型，如今也可以輕鬆流暢地運行在主流旗艦手機之上。這種對內存空間的極致釋放，將直接加速端側AI技術在移動設備上的普及與商用落地。

高能力保留率證實工程可復現性

在精簡模型體積的同時，BitCPM-CANN依然保持了極高的性能水準，其模型能力保留率成功維持在90%至97.2%之間。其中，三個主要尺寸模型的能力保留率均達到了95.7%—97.2%，即使是體積最小的0.5B模型，其保留率也超過了90%。

這一亮眼的評測結果，系統性地證明了低比特訓練技術路線具備極強的可擴展性與工程可復現性。面壁智能基於相關主幹搭建了完整的低比特訓練底座，涵蓋環境適配、32K長序列支持及融合算子等完整工程體系，爲後續面向昇騰的低比特訓練工作築牢了公共基礎設施。

相關推薦

面壁智能CTO曾國洋：從“打字機”到大模型，端側AI的進化與突圍

面壁智能另闢蹊徑，專注端側AI，將大模型壓縮進手機、汽車等終端。28歲CTO曾國洋早年主導訓練中國首個大語言模型CPM-1，如今致力推動輕量化智能落地移動設備。

8 小時追平、 2 天反超：面壁智能 ForgeTrain 如何用 AI“鍛造”下一代訓練框架？

大模型迭代加速，算力與工程成終極挑戰。面壁智能李宇軒在“AI4AI發酵夜”上詳解自研框架ForgeTrain，展示“AI製造AI”範式轉變，通過底層框架突破算力瓶頸與工程壁壘。

1.3B 模型的“降維打擊”：MiniCPM-V 4.6 重新定義端側多模態巔峯

面壁智能聯合清華大學及OpenBMB開源社區發佈新一代端側多模態大模型MiniCPM-V4.6，僅1.3B參數，推出Instruct與Thinking兩個版本，憑藉高智能密度與跨平臺適配能力，在多項評測中表現超越更大參數模型，加速端側AI應用落地。

面壁智能聯合清華大學發佈中國首個1.58-bit大模型BitCPM-CANN

面壁智能聯合清華大學及OpenBMB開源社區，發佈並開源了中國首個基於華爲昇騰平臺訓練的三值（1.58-bit）大模型BitCPM-CANN。該模型在低比特訓練領域取得突破，實現從量化算子到訓練算法的全鏈路原生開發，推出0.5B至8B四個尺寸版本，展示了國產算力平臺的強大實力。

面壁智能推出 MiniCPM-V 4.6 低內存高效率，人工智能新選擇

面壁智能聯合清華大學及OpenBMB開源社區發佈MiniCPM-V 4.6端側多模態大模型，僅1.3B參數、6G內存即可流暢運行，性能卓越，在內存漲價背景下實現“低內存、極速跑”，爲AI應用拓展新可能。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase