備受期待的Deepseek V3終於開源!這款全新的AI模型在多語言編程能力上取得了重大突破,其在aider多語言編程測評中的表現,甚至超越了Claude3.5Sonnet V2等競爭對手,引發了業界廣泛關注。

據瞭解,Deepseek V3相比之前的版本,在性能上實現了質的飛躍。Deepseek V2.5在aider測評中的成功率僅爲17%,而V3則暴增至48%,這充分展現了其強大的進步。

image.png

Deepseek V3採用了高達6850億參數的混合專家(MoE)架構。該架構包含256個專家,並使用sigmoid路由方式,每次選取前8個專家(topk=8)參與計算,這種設計使得模型能夠更加高效地處理複雜任務,並提高了性能。

Deepseek V3的開源,無疑將爲AI社區帶來新的活力。其強大的編程能力有望在軟件開發、自動化等領域發揮重要作用,爲各行各業的智能化升級注入新的動力。

地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main