DeepSeek近日正式發佈並開源了其最新研發的大型語言模型R1,該模型在性能上表現出色,被認爲可與OpenAI的o1正式版相媲美。這一舉措不僅標誌着國產AI技術的又一次重大突破,也爲全球AI開發者帶來了新的選擇。

DeepSeek R1在後訓練階段大規模應用了強化學習技術,即便是在極少標註數據的情況下,也顯著提升了模型的推理能力。在數學、代碼、自然語言推理等關鍵任務上,DeepSeek R1的性能均能與OpenAI o1正式版平分秋色,展示了其強大的實力。

image.png

爲了回饋開源社區,DeepSeek同時開源了DeepSeek-R1和DeepSeek-R1-Zero兩款模型,均採用660B參數規模。此外,DeepSeek還通過模型蒸餾技術,開源了6個小模型,其中包括32B和70B參數的模型。這些小模型在多項能力上超越了OpenAI的o1-mini,進一步豐富了開源生態。

image.png

在API定價方面,DeepSeek也展現了其開放的姿態:緩存命中每百萬輸入tokens僅需1元,未命中則爲4元;輸出tokens每百萬定價爲16元,整體定價更具競爭力。

image.png

更爲重要的是,DeepSeek R1採用了標準的MIT License,允許用戶無限制商用。同時,DeepSeek還鼓勵用戶利用R1的輸出結果訓練其他模型,進一步推動AI技術的普及和發展。DeepSeek R1的開源,無疑將爲全球開發者帶來更強大的工具,也爲AI技術的創新和應用注入新的活力,預示着AI技術平權化時代的加速到來。

論文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

API文檔:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model