大規模モデル産業が実用化とコスト管理の深水区に入り、月の暗面(Moonshot AI)傘下であるKimiの商業化の道筋も明確になってきています。最近、月の暗面のKimi B側担当者である黄震昕氏は業界サミットで会社の戦略的思考を共有しました。「ベースとなる構造において積極的なイノベーションを推進し、単なるエンジニアリングの積み重ねにとどまらない」と語りました。

モデルの価格設定とビジネスモデルについて、黄氏はKimiの定位が常に高性能モデルであることを強調しました。世界的な計算リソースの不足によりモデルの実行コストが高騰しているにもかかわらず、月の暗面は技術の最適化によってKV-Cacheのヒット率を90%以上にまで引き上げ、コストのプレッシャーを効果的に緩和し、ユーザーに高コストパフォーマンスのTokenサービスを提供しています。彼は明確に述べました。「モデルの価格を評価するには入力と出力の基本的な価格だけを見ているだけではいけません。実際に使用中のキャッシュヒット効率こそが、ユーザーの最終的な支出コストを決定する鍵です。」

To Bビジネスの展開において、Kimiは「できるところとできないところを分ける」という慎重な姿勢を見せています。黄氏は、「Kimiは過度な納品業務には関与しない」と述べ、モデルの能力を継続的に追求することに重点を置くと語りました。企業向けアプリケーションに必要な「最後の一マイル」のカスタマイズサービスは、主にFDE(エンドツーエンド)パートナーを通じて行われます。現在、Kimiは下層モデル、APIアーキテクチャおよびAgent製品からなる3層のサービス体系を構築しており、アマゾン・ウェブ・サービスなどの業界の巨頭と協力を深め、金融、医療、製造などの垂直分野の解決策の実現に取り組んでいます。

技術面では、Kimiは明らかにアーキテクチャ指向の特徴を示しています。同社はトレーニングにおいて2次オプティマイザ「Muon」を導入し、Kimi Linear AttentionアーキテクチャおよびAttention Residualスキームを発表しました。これらの取り組みによりデータ使用効率が顕著に向上し、モデルが長文タスクを処理する際の柔軟性が高まりました。「Harness」エンジニアリングの人気に対して、Kimi内部ではより実践的な「ループエンジニアリング(Loop Engineering)」に傾倒しています。モデルの基盤能力が強化されるにつれて、複雑な外部エンジニアリングの適合要件は段階的に減少すると考えているためです。