近日,人工智能領域迎來重大突破,AI公司深度求索(Deepseek)推出的Coder v2模型在多項測試中表現卓越,一舉超越谷歌的Gemini模型,成爲開源人工智能領域的新王者。根據Livebench AI(業內公認的最難以操縱的基準測試平臺)的評估結果,深度求索Coder v2模型僅次於OpenAI和Anthropic的商業模型,躍居開源模型的第三位。這一成績標誌着開源人工智能技術正在快速追趕商業巨頭。

image.png

Deepseek Coder v2在編程和推理能力方面表現尤爲出色。值得一提的是,該模型在數學領域的表現甚至超越了所有GPT-4變體。儘管在語言技能方面略顯遜色,但其在其他維度的優秀表現足以彌補這一短板。

與此同時,谷歌最新推出的Gemini大語言模型(LLM)雖然在人工評估排行榜上表現不俗,但被認爲並非真正優秀的模型。相比之下,DeepseekCoder v2在實際生產用例中的表現更爲出色。

業內專家預測,如果OpenAI和Anthropic將重心轉向輔助功能而非核心AI技術,開源模型很有可能在年底前登頂。這一趨勢表明,開源人工智能正在迅速縮小與商業巨頭之間的差距,未來發展潛力巨大。

DeepseekCoder v2的崛起不僅展示了開源社區的創新能力,也爲人工智能的民主化和多樣化發展注入了新的活力。隨着技術的不斷進步,我們有理由期待更多突破性的開源AI模型問世,推動整個行業向前發展。