月の暗面社は、最新作であるKimi K2モデルを正式に発表し、同時にオープンソース化することを発表しました。このモデルはMoEアーキテクチャに基づいており、強力なコード能力と優れた汎用エージェントタスク処理能力を持つため、AI分野で広く注目を集めています。

Kimi K2モデルの総パラメータ数は1Tであり、アクティブパラメータは32Bです。SWE Bench Verified、Tau2、AceBenchなどの一連のベンチマーク性能テストにおいて、オープンソースモデルの中でトップクラスの成績を収め、コード作成、エージェントタスク実行、数学的推論などにおける優れた実力を示しています。

予訓練段階では、Kimi K2は独自のMuonClipオプティマイザを使用しました。このオプティマイザにより、大規模なトレーニングにおけるattention logitsが大きくなる問題を効果的に解決し、トレーニングの安定性とトークン使用効率を新たなレベルに引き上げました。月の暗面チームは15.5Tトークンの平滑なトレーニングを成功させ、全行程でloss spikeが発生せず、トレーリルパラメータモデルの安定した高効率トレーニングに新たなアイデアを提供しました。

また、ベンチマーク性能テストでの優れた結果だけでなく、Kimi K2は実際の応用場面でも非常に高い能力の汎用性と実用性を示しています。コード能力に関しては、Kimi K2はデザイン性と視覚的な表現力を兼ね備えたフロントエンドコードを生成でき、パーティクルシステム、ビジュアライゼーション、3Dシーンなどの複雑な表現形式をサポートします。具体的な指示がない場合でも、完全な先物取引インターフェースを自動的に構築することができ、強い自律プログラミング能力を示しています。

微信截图_20250712095131.png

エージェントツール呼び出しにおいても、Kimi K2は優れた性能を発揮します。複雑な指示を安定して解析し、要件を一連のフォーマット規範に沿った、直接実行可能なToolCall構造に自動的に分解し、さまざまなエージェント/Codingフレームワークにスムーズに接続し、複雑なタスクや自動コード作成を完了できます。遠隔勤務の割合が給与に与える影響の分析、またはColdplayファン向けの追星計画を策定し、関連する計画を完成させるなど、Kimi K2はどちらも簡単にこなすことができ、強いエージェント能力を示しています。

さらに、Kimi K2はスタイル化された執筆においても顕著な向上を遂げました。研究テキストを中学生の口調に改写したり、アップルの広告文風を模倣したりするなど、Kimi K2は出力スタイルを正確に制御しながらも、元の意味と表現スタイルを保持することができます。フィクション執筆タスクにおいては、Kimi K2が生成する文章はより詳細と感情に焦点を当てており、抽象的で漠然とした内容ではなく、ユーザーに豊かな創作体験を提供しています。

月の暗面社は今回、Kimi K2モデルを発表しただけでなく、Kimi-K2-BaseとKimi-K2-Instructという2つのモデルバージョンを同時にオープンソース化しました。そのうち、Kimi-K2-Baseはインストラクション微調整を施していない基本的な事前学習モデルで、研究やカスタマイズ用途に適しています。一方、Kimi-K2-Instructは汎用的なインストラクション微調整バージョンで、ほとんどの質問応答およびエージェントタスクにおいて優れた性能を発揮します。モデルおよびfp8重みファイルはHuggingFaceプラットフォームにオープンソースされ、開発者に自由に利用可能です。

開発者が導入・使用しやすいように、vLLM、SGLang、ktransformersなどの推論エンジンもKimi K2モデルをサポートしています。開発者は自前のサーバーで展開し、KimiオープンプラットフォームAPIと同じ体験を得ることができます。

APIサービスにおいても、Kimi K2は包括的なサポートを提供しています。現在、APIサービスは全面的にリリースされており、最大128Kのコンテキストをサポートし、より強力な汎用性とツール呼び出し能力を持っています。料金プランは柔軟で合理的で、100万語の入力トークンあたり4元、出力トークンは16元で、OpenAIおよびAnthropicの2つのAPIフォーマットに対応しており、開発者がスムーズに切り替えることが可能です。