螞蟻集團旗下的百靈大模型今日宣佈,正式開源其最新成員Ling-2.6-flash。該模型同步推出了BF16、FP8、INT4 等多個量化版本,旨在爲全球開發者提供更靈活的硬件適配選擇,進一步降低AI部署的門檻。
作爲一款高性能模型,Ling-2.6-flash的總參數量達104B,其中激活參數爲7.4B。此前,該模型曾以匿名身份在國際主流評測平臺嶄露頭角,並根據開發者反饋完成了多輪針對中英文切換與代碼適配的深度優化。

推理效率實現質變
在技術架構層面,Ling-2.6-flash引入了先進的混合線性架構,極大地釋放了計算潛能。在主流的H20 顯卡環境下,其推理速度最快可達每秒 340 個Token,吞吐能力遠超行業同類競品。
除了速度優勢,該模型在智效比上表現驚人。評測數據顯示,在完成同等複雜程度的任務時,Ling-2.6-flash消耗的Token數量僅爲同級別模型的十分之一,有效降低了企業的長期運營成本。
定向增強智能體場景
針對當前火熱的Agent應用,螞蟻集團對模型進行了定向能力增強。無論是在複雜的工具調用,還是在長路徑的任務規劃中,Ling-2.6-flash都展現出了極強的邏輯執行力與任務成功率。
目前,該模型已在Hugging Face和ModelScope等主流開源社區同步上線。通過此次深度開源,螞蟻集團希望能夠賦能更多垂直領域的開發者,在保障數據隱私的同時,共同探索大模型應用的新邊界。
