正文

Deepseek V3開源！多語言編程能力飆升，力壓Claude 3.5 Sonnet V2

發布於AI新閒資訊

時間 :Dec 26, 2024

閱讀 :1分鐘

備受期待的Deepseek V3終於開源!這款全新的AI模型在多語言編程能力上取得了重大突破，其在aider多語言編程測評中的表現，甚至超越了Claude3.5Sonnet V2等競爭對手，引發了業界廣泛關注。

據瞭解，Deepseek V3相比之前的版本，在性能上實現了質的飛躍。Deepseek V2.5在aider測評中的成功率僅爲17%，而V3則暴增至48%，這充分展現了其強大的進步。

Deepseek V3採用了高達6850億參數的混合專家（MoE）架構。該架構包含256個專家，並使用sigmoid路由方式，每次選取前8個專家(topk=8)參與計算，這種設計使得模型能夠更加高效地處理複雜任務，並提高了性能。

Deepseek V3的開源，無疑將爲AI社區帶來新的活力。其強大的編程能力有望在軟件開發、自動化等領域發揮重要作用，爲各行各業的智能化升級注入新的動力。

地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main

美國大模型抄了DeepSeek作業：性能沒贏、價格更貴，卻精準卡住了美國企業的合規剛需

OpenAI前CTO穆拉蒂的初創公司發佈首款模型Inkling，其架構與數據大量借鑑DeepSeek和月之暗面等中國模型，卻在評測中表現落後且價格更高。這家中美角色“互換”的公司估值竟高達120億美元，反差巨大。

Jul 21, 2026

189.3k

AI主權新突破：德國研究聯盟發佈開源大模型Soofi S

德國研究聯盟發佈開源大模型Soofi S30B-A3B，助力歐洲主權AI。該模型採用混合專家架構，融合Mamba-2與注意力層，總參數量316億，但推理時每token僅激活部分參數，實現高效生成，爲高性能開源模型領域注入新活力。

Jul 14, 2026

200.4k

國產大模型再突破：Qwen3.6-35B-A3B正式開源，主打高效率與多模態思考

國產AI模型Qwen3.6-35B-A3B正式開源，採用混合專家架構，總參數量350億但推理時僅激活30億參數，實現“以小博大”的高效性能，顯著降低算力成本。

Apr 20, 2026

415.9k

上海 AI 實驗室發佈科學多模態模型書生Intern-S1-Pro

上海AI實驗室發佈全球最大開源科學多模態模型“書生 Intern-S1-Pro”，參數達1萬億。該模型基於“通專融合”架構SAGE，在科學能力上達到國際領先水平，尤其在複雜學科評測中展現出卓越的邏輯推理能力。

Feb 5, 2026

323.3k

騰訊自研大模型混元2.0發佈：多方面能力提升

騰訊自研大模型混元2.0（Tencent HY2.0）正式發佈，與此同時，DeepSeek V3.2也逐步接入騰訊生態。目前，這兩大模型已在元寶、ima等騰訊AI原生應用中率先上線，騰訊雲也同步開放了相關模型的API及平臺服務。全新發布的Tencent HY2.0採用混合專家（MoE）架構，總參數量高達4

Dec 6, 2025

808.7k

智啟未來，您的人工智能解決方案智庫