近日,這家以手機芯片聞名的巨頭宣佈推出兩款專爲雲端AI推理設計的全新芯片:AI200(2026年商用)與AI250(2027年推出),標誌着其從終端芯片廠商向全棧AI基礎設施玩家的關鍵躍遷。消息一出,高通股價單日飆升超20%,創2019年以來最大漲幅,資本市場用真金白銀投下信任票。

聚焦推理場景,以能效與成本破局
與英偉達主打訓練+推理的全能路線不同,高通選擇聚焦大模型推理市場,主打“低總擁有成本(TCO)+高能效+大內存”三大優勢。
- AI200支持高達768GB LPDDR內存,可作爲獨立加速卡或整機架系統交付,專爲大語言模型和多模態推理優化,滿足企業對高併發、低延遲推理的需求;
- AI250更進一步,引入近存計算(near-memory computing)架構,宣稱將內存帶寬提升10倍,同時大幅降低功耗,爲超大規模部署提供能效新標杆。
這一策略直擊當前數據中心痛點:隨着模型推理成本飆升,企業亟需高性價比、低功耗的專用方案,而非一味追求峯值算力。
十年磨一劍,Hexagon NPU成關鍵引擎
高通並非臨時起意。自2019年起,其已在物聯網與5G邊緣計算領域積累雲端芯片經驗,而核心武器正是其自研的Hexagon神經處理單元(NPU)。經過多年迭代,Hexagon已從手機端AI加速器進化爲可擴展至數據中心的高性能推理引擎,成爲高通挑戰雲端市場的技術支點。
巨頭圍獵英偉達,市場迎來“去單一化”拐點
儘管英偉達目前佔據AI芯片市場約90%份額,但客戶對供應鏈多元化的渴求日益強烈。谷歌(TPU)、亞馬遜(Trainium/Inferentia)、微軟(Maia)等雲廠商早已自研芯片,而高通的入局,爲第三方獨立供應商提供了新選擇。麥肯錫預測,到2030年全球數據中心投資將達6.7萬億美元,這片藍海足以容納多個玩家。
高通已拿下首個重量級客戶:沙特AI初創公司Humain計劃於2026年部署基於AI200/AI250的機架系統,總功率高達200兆瓦,相當於一座小型城市的用電規模。
能否撼動霸主?關鍵看生態與落地
挑戰英偉達,芯片性能只是入場券,軟件生態、開發者支持與實際部署效果纔是決勝關鍵。高通能否復刻其在移動端的生態整合能力,構建從工具鏈到框架的完整推理棧,將決定其能否真正分食高端市場。
但無論如何,高通的強勢入場,已爲AI芯片戰場投下重磅變量。當“手機芯片之王”決心在雲端掀起風暴,英偉達的護城河,或許不再固若金湯。
