國產開源大模型 DeepSeek R1 發佈，性能超越o1模型、成本降90%

正文:近期，中國的 DeepSeek 團隊重磅推出了其最新開源大模型 R1，受到了廣泛關注。R1模型的性能表現極其出色，在多項測試中均超越了 OpenAI 的 o1模型，尤其是在數學和編程方面的評估中表現優異。

在最新的美國 AIME2024測試中，R1以79.8分的成績超越 o1的79.2分。在 MATH-500測試中，R1獲得了97.3分，同樣領先於 o1的96.4分。此外，在 SWE-bench Verified 測試中，R1得分爲49.2，也超過了 o1的48.9分。雖然在代碼測試 Codeforces 中，R1僅比 o1低0.3分，但整體性能與 o1模型相當。

除了性能，R1的成本優勢更爲引人注目。OpenAI 的 o1模型每100萬 tokens 的輸入費用高達15美元，而 R1的費用僅爲0.14美元，成本降低了90%。在輸出方面，o1的費用爲60美元每100萬 tokens，而 R1僅需2.19美元，降低幅度達到27倍。這一巨大的成本差異，讓 R1在開源大模型領域中脫穎而出。

在 DeepSeek 團隊宣佈 R1開源後，許多國外網友紛紛表達了對這一模型的讚歎，認爲 R1在性價比和性能方面都超越了 Meta、Mistral 等老牌開源平臺。許多人表示，R1模型的高效推理能力使其在代碼編寫和數學解釋等方面表現優異，甚至有用戶稱其爲 “最像人類內心獨白的模型”。同時，蘋果公司的機器學習研究員 Awni Hannun 也對 R1進行了測試，發現其在蘋果 M2Ultra 上運行迅速且推理效率高。

R1模型的開發經歷了多個階段的訓練流程，包括冷啓動數據和多階段訓練，以提高其推理能力和可讀性。這些技術改進確保了 R1模型在各種任務中的卓越表現。

隨着 R1的發佈，中國的開源大模型在國際市場上再次引起了極大的關注與討論，許多技術愛好者對此模型的潛力表示期待。R1的發佈標誌着中國在大模型技術領域的進一步突破，推動了開源技術的發展。

開源地址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

劃重點:
🌟 R1模型在多項測試中超越 OpenAI 的 o1，顯示出卓越的性能表現。
💰 R1的輸入和輸出成本分別低至0.14美元和2.19美元，成本降低幅度達90%。
🚀 R1開源後受到廣泛關注，許多國外專家對其性能表示讚賞，認爲其性價比超高。

國產開源大模型 DeepSeek R1 發佈，性能超越o1模型、成本降90%

相關推薦

Cloudflare聯手OpenAI，AI搜索技術迎來新突破

OpenAI高薪挖投行人才：年薪 139 萬加股權，要用AI重塑華爾街

美國企業“棄用”頭部AI：中國模型憑藉高性價比突圍

OpenAI又走一員大將：田永龍疑似投奔騰訊混元，將執掌多模態方向

美國放行GPT-5.6，OpenAI多款重磅模型本週上線

​國產開源大模型 DeepSeek R1 發佈，性能超越o1模型、成本降90%

相關推薦

Cloudflare聯手OpenAI，AI搜索技術迎來新突破

OpenAI高薪挖投行人才：年薪 139 萬加股權，要用AI重塑華爾街

美國企業“棄用”頭部AI：中國模型憑藉高性價比突圍

OpenAI又走一員大將：田永龍疑似投奔騰訊混元，將執掌多模態方向

美國放行GPT-5.6，OpenAI多款重磅模型本週上線

國產開源大模型 DeepSeek R1 發佈，性能超越o1模型、成本降90%