近日,Meta 公司宣佈成立了全新的超級智能實驗室(Meta Superintelligence Labs,MSL),並發表了首篇重要論文,研究成果顯著提升了大語言模型在檢索增強生成(RAG)任務中的推理速度,提升幅度達到了30倍以上。

這篇論文名爲《REFRAG:Rethinking RAG based Decoding》,主要探討如何讓大型語言模型在執行 RAG 任務時,快速提煉出重要信息,以減少計算量並縮短反應時間,而同時保持準確性不變。Meta 超級智能實驗室的成立標誌着公司在人工智能領域的進一步發力,尤其是在當前激烈的競爭環境下,扎克伯格急需推動 AI 技術的發展。

image.png

Meta 超級智能實驗室於今年6月正式成立,總部位於加利福尼亞州的門洛帕克,旨在研發超級智能技術。根據報道,扎克伯格在4月份對 Meta 最新發佈的 Llama4模型表現不滿,甚至要求員工加班加點來改進。這促使他成立了這個新實驗室,並引入了大量頂尖人才,包括 Scale AI 的創始人 Alexandr Wang。

在實驗室內部,團隊被分爲四個小組,分別負責大語言模型的研發、人工智能基礎研究、產品技術落地以及基礎設施的保障。REFRAG 框架的提出,正是實驗室在優化大語言模型性能方面的第一步。

REFRAG 框架的核心理念是,通過一個輕量級模型將冗長的上下文內容壓縮成摘要,減少解碼器處理的輸入信息。這種方法不僅加快了處理速度,還降低了計算量,提高了模型的效率。此外,研究團隊還採用了 “持續預訓練” 的方法,通過重建任務訓練模型,以便在壓縮信息的同時,儘量保留重要的細節。

經過全面測試,REFRAG 在多種任務中表現出色,尤其在時間延遲和吞吐量方面大幅提升。實驗結果顯示,REFRAG 在壓縮比爲16倍的情況下,能夠在速度上超越之前的最先進模型 CEPE,並且在準確性上幾乎沒有損失。

這一創新成果爲 Meta 在人工智能領域的發展注入了新的動力,同時也展示了其在提升大模型推理效率方面的前瞻性思考。

論文:https://arxiv.org/abs/2509.01092

劃重點:

🌟 Meta 成立超級智能實驗室,旨在推動 AI 技術的發展。

⚡ 新論文《REFRAG》實現 RAG 推理速度提升30倍,減少計算量。

🚀 REFRAG 框架通過信息壓縮,提升大語言模型的效率與準確性。