近日,硅基流动(SiliconCloud)平台正式上线了月之暗面开源的 MoE 模型 Kimi K2。这款模型总参数达到1T,激活参数为32B,在各项基准性能测试中表现不俗,能够与顶尖的商业模型相媲美。Kimi K2特别擅长编码和通用智能体(Agent)任务,为开发者提供了一个强有力的工具。

image.png

Kimi K2模型支持高达128K 的最大上下文长度,提供了具有竞争力的定价:输入费用为每百万个 Tokens4元,输出费用为每百万个 Tokens16元。此外,硅基流动还上线了另一款编程大模型 Kimi-Dev-72B,进一步扩展了其产品线。

image.png

用户可以通过硅基流动的国内和国际站点体验 Kimi K2。新用户在注册后可自动获得14元的试用金,方便他们在平台上进行首次尝试。国内用户可通过 [国内站在线体验链接](https://cloud.siliconflow.cn/models) 使用该模型,国际用户则可以访问 [国际站在线体验链接](https://cloud.siliconflow.com/models)。

在技术特点方面,Kimi K2具备三个主要优势:首先是大规模训练,它在15.5T Tokens 的数据上进行了训练,确保了模型的稳定性;其次,Kimi K2采用了 MuonClip 优化器,这一优化器可以在大规模扩展过程中保持稳定;最后,Kimi K2是专为工具调用、逻辑推理和自主解决问题而设计的智能体驱动型模型。

根据公开的基准测试数据,Kimi K2在自主编程、工具调用和数学推理等能力方面表现出色。月之暗面表示,Kimi K2为构建通用智能体能力奠定了坚实基础,未来还将增加思考和视觉理解等能力。

用户对于 Kimi K2的评价普遍积极。例如,Perplexity 创始人 Aravind Srinivas 称赞其在内部评估中的优异表现,并表示很快会基于该模型进行后续训练。此外,有用户反映,Kimi K2在一次性完成网页版 Minecraft 的任务时展现了惊人的能力,远超其他模型。

除了其出色的编码能力外,Kimi K2在语言能力方面也受到了用户的好评,显示出其使用的词汇更加多样化。用户对 Kimi K2的整体表现表示满意,并期待未来的更新与扩展。

划重点:  

🌟 Kimi K2模型参数达1T,支持128K 上下文长度,表现出色。  

💰 新用户可享受14元试用金,方便体验模型功能。  

🛠️ Kimi K2具备大规模训练、稳定优化和智能体驱动设计,适用于多种应用场景。