正文

4000 億參數“生啃”成功！iPhone 17 Pro 挑戰本地運行超大模型，但速度只有 0.6 token

發布於AI新閒資訊

時間 :Mar 24, 2026

閱讀 :1分鐘

智能手機的算力極限在哪裏?蘋果的最新旗艦iPhone17Pro剛剛給出了一個既令人震撼又略顯尷尬的答案。

3月23日，擁有 4000億參數 的大語言模型在iPhone17Pro上成功跑通。要知道，即便經過量化壓縮，此類模型通常也需要至少200GB 的內存才能運行，而iPhone17Pro的硬件配置僅爲12GB LPDDR5X 內存。

技術“黑科技”: 閃存流轉與混合專家模型

在內存容量嚴重不足的情況下，這次“不可能的任務”主要依靠兩個技術路徑實現:

SSD 強行“擴容”: 藉助 Flash-MoE 開源項目，設備直接從固態硬盤（SSD）向 GPU 流式傳輸數據，突破了物理內存的上限。

MoE 架構優勢: “MoE”代表混合專家模型（Mixture of Experts），這意味着系統在生成每個單詞時，只需要調用4000億參數中的一小部分，而非全量負載。

速度硬傷:每兩秒蹦出一個詞

雖然“跑通了”，但實際體驗距離“可用”還有巨大的鴻溝。實測顯示:

生成速度: 僅爲 0.6Token/秒。換句話說，大約每1.5到2秒才能生成一個單詞。

功耗壓力: 這種高強度的本地運算會極速消耗手機的電池壽命，發熱情況也不容小覷。

行業啓示:本地大模型的“奇點”將至?

儘管目前的生成速度讓人“抓狂”，但這次演示的象徵意義遠大於實用價值。它證明了在手機端本地運行頂級規模大模型並非死路一條。

隱私護城河: 本地運行意味着數據無需上傳雲端，能夠提供極高的隱私保護。

離線可行性: 在無網絡環境下獲取頂級 AI 的回覆正在成爲可能。

正如業內評價，“能跑起來”和“能流暢使用”是兩碼事。但隨着算法優化與硬件迭代，當0.6token 進化到60token 時，智能手機將真正進化爲隨身攜帶的“超級大腦”。

DeepSeek Code 即將上線

DeepSeek公司融資突破700億元，管理層宣佈未來將專注突破性AI研究，而非短期商業化。戰略轉向全力開發新產品，特別是備受關注的DeepSeek Code，已在招聘網站發佈“Agent Harness”等多個相關崗位。

Spotify在2026年投資者日推出核心AI戰略載體——Studio by Spotify Labs，標誌其從音頻播放器轉型爲生成式音頻平臺。該桌面應用內置全能AI助理，可連接日曆、郵箱、筆記，具備網頁瀏覽與信息整理能力，並支持根據用戶日程表定製個人音頻內容。

OpenAI於5月22日發佈ChatGPT for PowerPoint插件（Beta版），將AI嵌入PowerPoint底層架構，實現零門檻免費使用。用戶無需付費，即可通過該插件在幻燈片創作中獲得AI輔助，終結傳統PPT製作的繁瑣過程。

美國總統特朗普突然取消原定簽署的AI監管行政令，該法令旨在加強政府監管，但在簽署前因白宮內部和科技巨頭強烈反對而瓦解。特朗普對監管AI缺乏興趣，擔心條款過於嚴格，導致最終放棄。

英國數學家圖靈1950年提出的圖靈測試設想，在76年後由加州大學聖地亞哥分校研究團隊在《美國國家科學院院刊》發表論文證實。認知科學家卡梅倫·瓊斯和本·伯根教授通過嚴格的經典三方圖靈測試，首次提供確鑿實證數據，標誌着計算機科學史上的里程碑時刻。

智啟未來，您的人工智能解決方案智庫