人工智能大模型的競賽場上,又添了一位重量級選手。近日,美團正式對外發布了其最新研發的萬億參數大模型——LongCat-2.0,並宣佈全面開源,旨在推動行業技術交流與應用落地。

LongCat-2.0 展現了國產算力集羣的強大潛能。據悉,該模型是在五萬卡國產算力集羣上完成的全流程訓練與推理,不僅驗證了國產軟硬件在大規模分佈式計算中的可靠性,也爲業內構建超大規模模型提供了參考範式。從技術規格上看,LongCat-2.0 總參數量高達 1.6T,採用動態範圍設計(激活參數約 48B,動態範圍覆蓋 33B 至 56B),這種設計在保證海量知識儲備的同時,兼顧了推理的靈活性與效率。

在數據支撐與上下文處理能力方面,LongCat-2.0 同樣表現不俗。其預訓練數據規模超過 30T tokens,不僅深度覆蓋了中文與英文語料,還融合了多語言及高質量代碼數據,實現了跨領域的邏輯理解。更爲亮眼的是,該模型原生支持 1M 超長上下文,這意味着它在處理長篇文檔分析、複雜代碼庫構建等任務時,能夠保持極高的連貫性與準確度。

此次美團選擇將 LongCat-2.0 開源,無疑爲開發者社區注入了新的活力。作爲一款具備萬億參數量級的開源模型,它不僅標誌着美團在人工智能底層技術研發上的持續深耕,也爲國內大模型生態的繁榮貢獻了重要算力底座。未來,隨着該模型的廣泛應用,我們有望看到更多基於超長上下文理解的創新 AI 應用涌現。