在剛剛落幕的WWDC2026 上,LM Studio與蘋果完成了一場令人矚目的技術演示——僅用四臺Mac Studio組成的集羣,就成功運行了月之暗面的萬億參數大模型Kimi K2.6。這一成果打破了"萬億模型必須依賴雲端GPU集羣"的固有認知,讓消費級硬件承載前沿AI算力成爲現實。
Kimi K2. 6 總參數規模高達 1 萬億,採用MoE架構,激活參數爲 320 億,支持長上下文、多模態輸入及智能體任務處理。此次演示中,四臺Mac Studio通過蘋果的內存共享和互聯技術組成集羣,統一內存總量約達1.5TB,足以滿足這一巨型模型的推理需求。此前開發者測試顯示,在類似配置下Kimi K2. 6 可達到約28 tokens/s的生成速度,而功耗遠低於傳統GPU方案。
從iPhone直連本地集羣,數據全程不出門
更值得關注的是,演示中還展示了LM Studio的LM Link遠程訪問功能。用戶可以在MacBook Neo筆記本和iPhone上安全地遠程連接到Mac Studio集羣,與正在運行的模型實時交互,而所有數據和通信始終保持本地化處理,不走雲端。
LM Link已更新至LM Studio的Mac應用和Locally AI的iOS應用中,支持端到端加密連接。這一設計讓用戶即使手握輕量設備,也能隨時調用集羣級的AI算力,同時不必擔心隱私泄露風險。配合蘋果Thunderbolt 5 RDMA等多設備內存共享技術,整個生態在AI本地化部署方面的技術閉環正在加速成型。
此次合作釋放了一個清晰信號:本地部署萬億參數大模型不再是遙不可及的實驗室概念,而是正在走向開發者案頭的工程現實。隨着蘋果硬件互聯能力的持續進化,消費級設備承載大規模AI推理的邊界,有望被進一步拓寬。
