據知情人士透露,全球 AI 領軍企業OpenAI近期正積極系統性地尋找英偉達之外的算力替代方案。這一動作源於其對英偉達最新一代 AI 芯片在特定推理環節(尤其是響應速度)表現的失望。
核心痛點:推理速度制約用戶體驗
OpenAI發現,在代碼生成及複雜的軟件系統交互用例中,現有硬件的響應速度已成爲瓶頸:
戰略重心偏移:OpenAI正在將關注點從模型“訓練”轉向“推理”(即向終端用戶輸出答案的過程)。
延遲與吞吐:推理階段的性能直接掛鉤用戶體驗與運營成本。在高帶寬、低延遲的特定任務下,傳統 GPU 架構因需頻繁訪問外置顯存而產生的延遲,讓芯片長時間處於“等數據”狀態。
專業用戶的高要求:CEO 山姆·奧特曼指出,開發者等專業用戶對代碼類模型的生成速度極度敏感,而當前的硬件架構限制了相關產品的體驗。
替代方案:牽手推理加速“新勢力”
爲了解決硬件瓶頸,OpenAI計劃引入新型硬件來分擔未來約10% 的推理算力需求:
引入 Cerebras:OpenAI已與 Cerebras 達成合作。後者的架構在同一塊芯片中集成了海量靜態存儲(SRAM),能極大地縮短訪問路徑,提升響應速度。
洽談 Groq:公司此前也曾與 Groq 接觸,尋求利用其推理加速特長來優化聊天機器人等 AI 系統。
巨頭博弈:原本“板上釘釘”的投資生變
這種技術路線的調整也讓OpenAI與長期核心供應商英偉達的關係變得微妙:
千億交易停滯:雙方原本正在洽談一項涉及1000億美元 的投資與供貨協議(英偉達以芯片換股權),但該談判已拖延數月。
採購多元化:OpenAI已經與 AMD 等其他廠商簽署了新的 GPU 採購或合作協議,進一步分散了對單一供應商的依賴。
競爭壓力:相比之下,Anthropic 的 Claude 以及谷歌的 Gemini 更多依賴谷歌自研的 TPU,這種專用芯片在推理任務上的天然優勢給了英偉達巨大壓力。
儘管雙方在公開場合仍維持積極的合作形象,英偉達CEO 黃仁勳也極力否認不和傳聞,但隨着OpenAI開始真金白銀地爲第三方推理芯片下單,AI 算力市場的“一超多強”格局正面臨重塑。
