正文:近期,中國的 DeepSeek 團隊重磅推出了其最新開源大模型 R1,受到了廣泛關注。R1模型的性能表現極其出色,在多項測試中均超越了 OpenAI 的 o1模型,尤其是在數學和編程方面的評估中表現優異。

image.png

最新的美國 AIME2024測試中,R1以79.8分的成績超越 o1的79.2分。在 MATH-500測試中,R1獲得了97.3分,同樣領先於 o1的96.4分。此外,在 SWE-bench Verified 測試中,R1得分爲49.2,也超過了 o1的48.9分。雖然在代碼測試 Codeforces 中,R1僅比 o1低0.3分,但整體性能與 o1模型相當。

除了性能,R1的成本優勢更爲引人注目。OpenAI 的 o1模型每100萬 tokens 的輸入費用高達15美元,而 R1的費用僅爲0.14美元,成本降低了90%。在輸出方面,o1的費用爲60美元每100萬 tokens,而 R1僅需2.19美元,降低幅度達到27倍。這一巨大的成本差異,讓 R1在開源大模型領域中脫穎而出。

在 DeepSeek 團隊宣佈 R1開源後,許多國外網友紛紛表達了對這一模型的讚歎,認爲 R1在性價比和性能方面都超越了 Meta、Mistral 等老牌開源平臺。許多人表示,R1模型的高效推理能力使其在代碼編寫和數學解釋等方面表現優異,甚至有用戶稱其爲 “最像人類內心獨白的模型”。同時,蘋果公司的機器學習研究員 Awni Hannun 也對 R1進行了測試,發現其在蘋果 M2Ultra 上運行迅速且推理效率高。

R1模型的開發經歷了多個階段的訓練流程,包括冷啓動數據和多階段訓練,以提高其推理能力和可讀性。這些技術改進確保了 R1模型在各種任務中的卓越表現。

隨着 R1的發佈,中國的開源大模型在國際市場上再次引起了極大的關注與討論,許多技術愛好者對此模型的潛力表示期待。R1的發佈標誌着中國在大模型技術領域的進一步突破,推動了開源技術的發展。

開源地址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

劃重點:

🌟 R1模型在多項測試中超越 OpenAI 的 o1,顯示出卓越的性能表現。  

💰 R1的輸入和輸出成本分別低至0.14美元和2.19美元,成本降低幅度達90%。  

🚀 R1開源後受到廣泛關注,許多國外專家對其性能表示讚賞,認爲其性價比超高。