OpenAI宣佈推出兩款開源權重語言模型——gpt-oss-120bgpt-oss-20b,這是自2019年GPT-2發佈以來,OpenAI首次迴歸開源領域。此舉不僅標誌着OpenAI戰略的重大轉向,也爲全球AI開發者提供了強大的推理工具,加速AI技術的普及與創新。

image.png

開放權重模型,賦予開發者更大自由

根據OpenAI官方公告,gpt-oss-120b和gpt-oss-20b採用Apache2.0許可證發佈,允許開發者自由下載、修改和用於商業用途。這兩款模型分別是1170億參數和210億參數的混合專家(MoE)架構,分別激活51億和36億參數,兼顧高效推理與低資源消耗。

image.png

  • gpt-oss-120b:能在單個NVIDIA H100GPU(80GB內存)上運行,適合數據中心或高端企業場景,性能接近OpenAI的專有模型o4-mini,尤其在競賽編程(Codeforces)、通用問題解決(MMLU、HLE)及健康相關查詢(HealthBench)上表現突出。
  • gpt-oss-20b:僅需16GB內存即可在邊緣設備上運行,適合本地推理和設備端應用,性能媲美o3-mini,特別是在競賽數學(AIME2024&2025)等領域表現優異。

這些模型支持長達128k token的上下文長度,採用交替密集和局部帶狀稀疏注意力機制,並使用分組多查詢注意力技術以提升推理效率。OpenAI還開源了‘o200k_harmony’分詞器,進一步降低開發門檻。

安全與責任並重,重新定義開源標準

OpenAI在發佈中強調,安全是gpt-oss系列的核心原則。針對開源模型可能被惡意微調的風險,OpenAI對gpt-oss-120b進行了對抗性微調測試,並通過其“準備框架”(Preparedness Framework)驗證,確認即使經過惡意優化,模型在生物、化學及網絡安全領域也未達到高風險能力水平。外部安全專家的審查進一步提升了模型的安全標準。

此外,OpenAI呼籲開發者在使用模型時,結合自身需求實施額外安全措施,以應對多樣化應用場景中的潛在風險。模型卡和研究論文中詳細披露了安全測試結果,爲開源社區提供了透明參考。

image.png

image.png

戰略轉向,應對開源競爭與企業需求

OpenAI此舉被認爲是應對開源領域競爭的戰略調整。近年來,Meta、DeepSeek等公司通過開放模型搶佔市場,迫使OpenAI重新審視其閉源策略。OpenAI首席執行官Sam Altman在Reddit AMA中曾表示,公司過去的開源路線“走錯了方向”,此次發佈則是兌現其迴歸開源承諾的第一步。

同時,gpt-oss系列滿足了企業對本地化部署和數據隱私的需求。金融、醫療、法律等高監管行業可將模型部署在私有服務器上,避免數據泄露風險。OpenAI還與瑞典國家人工智能中心AI Sweden等機構合作,探索區域性微調以提升模型在特定語言和文化背景下的表現。

開發者生態賦能,開啓AI新可能

gpt-oss系列支持多種開發框架,如Transformers、vLLM、Ollama和llama.cpp,開發者可通過Hugging Face、GitHub等平臺下載模型權重,並利用OpenAI提供的參考代碼快速上手。模型內置鏈式推理(Chain-of-Thought)、工具調用(支持Python代碼執行、網頁搜索等)及結構化輸出(JSON、YAML等),特別適合構建智能體工作流。

此外,模型支持三種推理等級(低、中、高),開發者可根據任務需求平衡速度與精度。

gpt-oss的發佈不僅爲開發者提供了高性能、低成本的AI工具,也對AI行業格局產生了深遠影響。相較於Meta的Llama或DeepSeek的R1,gpt-oss在推理能力和工具使用上具有明顯優勢,但其文本單模態的限制也意味着需通過API調用補充多模態功能。

OpenAI表示,未來將根據社區反饋持續優化gpt-oss系列,但未承諾具體更新計劃。業內專家認爲,此舉可能推動更多企業採用混合AI策略,即結合開源模型與雲端服務,兼顧成本與靈活性。

官方博客:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/