清華聯合面壁智能在《自然・機器智能》發文,提出“能力密度”(Capability Density)指標——單位參數可承載的有效智能,指出模型性能應“重密度、輕規模”。團隊統計51個主流開源大模型發現,密度約每3.5個月翻倍,同等任務所需參數量可指數級下降。

111.jpg

研究強調,高密度≠簡單壓縮,“字典塞小本”會損失智力,需用“數據-算力-算法”協同設計。面壁智能據此推出0.5B-2B系列“高密度”模型,在同等下游任務上性能達7B-13B水平,已規模化落地手機語音助手、車載交互與智能家居邊緣盒子,推理延遲<100ms,端側功耗下降45%。

面壁智能CEO李丹表示,下一步將聯合清華把密度提升曲線納入模型研發KPI,目標2026年推出“揹包級”個人大模型,可在NPU手錶端運行,推動“模型小型化”生態。