模型變小，能力不減：新浪VibeThinker-3B 開源，AI 推理迎來“輕量化”新思路

人工智能模型的參數量是否一定要“越大越好”?近日，新浪開源的 VibeThinker-3B 模型給出了一份極具啓發性的答卷。儘管該模型僅擁有30億參數，但在數學、編程等高難度基準測試中，它竟然展現出了足以媲美主流百倍規模大模型的強悍性能，甚至在部分競賽級任務中超越了多款行業頂尖產品。

VibeThinker-3B 的優異表現並非偶然，而是得益於其獨特的訓練策略。該模型以阿里 Qwen2.5-Coder-3B 爲基底，通過多階段的精細化“後訓練”——涵蓋了監督微調、強化學習、自蒸餾及指令微調等環節，將大模型的邏輯推理能力深度濃縮進了3B 的輕量化架構中。測試顯示，在 LeetCode 競賽題目中，它能高效完成128道題中的123道，這一成績已超過了 GPT-5.2等行業標杆。

此次發佈最引人深思的，是研發團隊提出的“參數壓縮-覆蓋假說”。研究發現，AI 的能力並非“鐵板一塊”:像邏輯推理、編程運算這種結構清晰的任務，通過特定模式的訓練，可以被極高密度地壓縮;而廣泛的世界知識儲備，則依然依賴龐大的參數量來支撐。這意味着，未來在推理任務中，我們未必一定要調用成本昂貴的超大模型。

目前，VibeThinker-3B 已在Hugging Face和GitHub正式開源。這一動作不僅爲開發者提供了一個輕量且高效的工具選擇，也爲 AI 行業提供了一種全新的優化範式:在特定任務領域，通過精耕細作的後訓練，或許能以極低的算力成本，換取堪比“行業巨頭”的推理體驗。

讓Agent越用越強:AReaL2.0開源，打造面向自演進智能體的RL基礎設施

7月2日，開源強化學習基礎設施項目AReaL發佈2.0版，旨在打通基礎模型訓練與智能體應用間的鏈路，爲Agent場景提供強化學習訓練支撐。2.0版面向真實業務，提供持續學習基礎設施，可記錄、整理Agent在任務中的交互過程並接入後續訓練流程，讓智能體在使用中持續進化。

警惕“AI 蒸餾”：Meta 封殺競品編碼工具，大模型行業護城河博弈升級

Meta被曝禁止工程師使用Anthropic的Claude Code和OpenAI的Codex，此舉揭開AI企業間“模型蒸餾”博弈序幕。蒸餾指利用強模型輸出訓練新模型，Meta的核心憂慮是防範對手通過員工使用競品工具，間接獲取數據或知識以複製優化自身模型。

告別“一刀切”：Cloudflare 推出精細化 AI 流量管理，築起網站變現護城河

網站主面臨AI爬蟲氾濫的兩難：既要搜索流量，又恐內容被竊或廣告被擾。7月1日，Cloudflare推出AI流量管理工具，支持站長按爬蟲類型精細化管控，打破了過去“一刀切”式屏蔽的侷限，在保留搜索引擎曝光的同時，有效防止數據濫用。

模型變小，能力不減：新浪VibeThinker-3B 開源，AI 推理迎來“輕量化”新思路

相關推薦

讓Agent越用越強:AReaL2.0開源，打造面向自演進智能體的RL基礎設施

警惕“AI 蒸餾”：Meta 封殺競品編碼工具，大模型行業護城河博弈升級

無縫升級!阿里打包升級QoderWork等多款AI工具，聚焦企業核心場景

美團大模型生態調整：全面限用豆包，力推自研 LongCat 體系

告別“一刀切”：Cloudflare 推出精細化 AI 流量管理，築起網站變現護城河