近日,硅基流動(SiliconCloud)平臺正式上線了月之暗面開源的 MoE 模型 Kimi K2。這款模型總參數達到1T,激活參數爲32B,在各項基準性能測試中表現不俗,能夠與頂尖的商業模型相媲美。Kimi K2特別擅長編碼和通用智能體(Agent)任務,爲開發者提供了一個強有力的工具。
Kimi K2模型支持高達128K 的最大上下文長度,提供了具有競爭力的定價:輸入費用爲每百萬個 Tokens4元,輸出費用爲每百萬個 Tokens16元。此外,硅基流動還上線了另一款編程大模型 Kimi-Dev-72B,進一步擴展了其產品線。
用戶可以通過硅基流動的國內和國際站點體驗 Kimi K2。新用戶在註冊後可自動獲得14元的試用金,方便他們在平臺上進行首次嘗試。國內用戶可通過 [國內站在線體驗鏈接](https://cloud.siliconflow.cn/models) 使用該模型,國際用戶則可以訪問 [國際站在線體驗鏈接](https://cloud.siliconflow.com/models)。
在技術特點方面,Kimi K2具備三個主要優勢:首先是大規模訓練,它在15.5T Tokens 的數據上進行了訓練,確保了模型的穩定性;其次,Kimi K2採用了 MuonClip 優化器,這一優化器可以在大規模擴展過程中保持穩定;最後,Kimi K2是專爲工具調用、邏輯推理和自主解決問題而設計的智能體驅動型模型。
根據公開的基準測試數據,Kimi K2在自主編程、工具調用和數學推理等能力方面表現出色。月之暗面表示,Kimi K2爲構建通用智能體能力奠定了堅實基礎,未來還將增加思考和視覺理解等能力。
用戶對於 Kimi K2的評價普遍積極。例如,Perplexity 創始人 Aravind Srinivas 稱讚其在內部評估中的優異表現,並表示很快會基於該模型進行後續訓練。此外,有用戶反映,Kimi K2在一次性完成網頁版 Minecraft 的任務時展現了驚人的能力,遠超其他模型。
除了其出色的編碼能力外,Kimi K2在語言能力方面也受到了用戶的好評,顯示出其使用的詞彙更加多樣化。用戶對 Kimi K2的整體表現表示滿意,並期待未來的更新與擴展。
劃重點:
🌟 Kimi K2模型參數達1T,支持128K 上下文長度,表現出色。
💰 新用戶可享受14元試用金,方便體驗模型功能。
🛠️ Kimi K2具備大規模訓練、穩定優化和智能體驅動設計,適用於多種應用場景。