螞蟻集團旗下的百靈大模型系列於今日迎來重要更新,
作爲一款總參數量達到104B、激活參數量爲7.4B 的 Instruct 模型,

技術亮點:混合架構與極致效率
混合線性架構: 通過底層的計算優化,模型展現了極佳的推理速度。在4卡 H20環境下,其推理速度最高可達340tokens/s。在 Prefill(預填充)吞吐指標上,更是達到了 Nemotron-3-Super 的2.2倍,大幅縮短了響應延遲。
出色的“智效比”: 研發團隊在訓練過程中對 Token 效率進行了深度校準。評測數據顯示,完成同等質量的任務,
僅需消耗約15M tokens,這一數值僅爲同類競品的十分之一,極大地降低了商用成本。Ling-2.6-flash
場景深耕:定向增強智能體能力
針對當前大模型應用最廣泛的 Agent(智能體)場景,
目前,開發者已可通過 Hugging Face 和 ModelScope(魔搭社區)獲取該模型的開源資源,進一步探索其在各類行業應用中的潛力。
