隨着大模型產業進入比拼落地應用與成本控制的深水區,月之暗面(Moonshot AI)旗下的 Kimi 商業化路徑也愈發清晰。近日,月之暗面 Kimi B 端負責人黃震昕在行業峯會上分享了公司的戰略思考:堅持在底層架構上主動創新,而非僅僅做工程上的簡單堆砌。

談及模型定價與商業模式,黃震昕強調,Kimi 的定位始終是高性能模型。儘管全球算力供應緊張推高了模型運行成本,但月之暗面通過技術優化,使 KV-Cache 命中率達到90% 以上,從而有效對衝了成本壓力,並能爲用戶提供高性價比的 Token 服務。他明確表示,評估模型價格不能僅看輸入輸出的基準定價,實際使用中的緩存命中效率纔是決定用戶最終支出成本的關鍵。

在 To B 業務佈局上,Kimi 展現出了一種“有所爲有所不爲”的審慎態度。黃震昕指出,Kimi 不會涉足過重的交付業務,而是將重心放在模型能力的持續攻克上。企業級應用所需的“最後一公里”定製化服務,將主要通過 FDE(端到端)合作伙伴來完成。目前,Kimi 已構建起由底層模型、API 架構及 Agent 產品組成的三層服務體系,並正與亞馬遜雲科技等行業巨頭深化合作,共同推進金融、醫療及製造等垂直領域的解決方案落地。

在技術層面,Kimi 展現了明顯的架構導向特徵。公司已在訓練中引入了二階優化器 Muon,並推出了 Kimi Linear 注意力架構及注意力殘差方案。這些舉措顯著提升了數據使用效率,使得模型在處理長文本任務時更加遊刃有餘。面對“Harness”工程的熱度,Kimi 內部則更傾向於實踐“循環工程”(Loop Engineering),認爲隨着模型基座能力的增強,複雜的外部工程適配需求將逐步降低。

對於未來,月之暗面將繼續在智能體的聰明程度、長上下文處理能力以及多智能體協作能力這三個維度上深耕。隨着 Kimi K2.7等高性能模型陸續登陸雲端平臺,通過技術創新將能源高效轉化爲智能,已成爲這家公司在 AI 產業長跑中的核心目標。