騰訊的研究者們發現,大語言模型的性能會隨着實例化agent數量的增加而增強,無需複雜的多LLM agents協作框架。實驗結果顯示多個小LM集成可以超越較大LM的性能。論文探討了性能提升與問題難度之間的關係,並提出了逐步採樣和投票、分層採樣和投票兩種優化策略。
相關推薦
AI大模型在基層執法落地,豆包助力警務破案跑出“加速度”
湖北潛江警方在偵破一起工地柴油盜竊案時,面對無監控、無目擊證人的“零線索”現場,藉助字節跳動旗下AI大模型工具“豆包”,將案發現場提取的1440mm關鍵輪距數據輸入模型,成功實現案件突破。這展現了大語言模型向基層社會治理和智慧警務領域滲透的實戰價值。
May 18, 2026
154.6k
加速國產大模型:AMD推出vLLM-ATOM插件大幅提升推理效率
AMD發佈vLLM-ATOM插件,專爲大語言模型部署優化,在不改變現有工作流下,顯著提升DeepSeek-R1、Kimi-K2等國產大模型在AMD硬件上的推理性能。該插件針對Instinct系列GPU定製,利用vLLM框架的高顯存利用率優勢,讓開發者以低學習成本實現技術遷移,獲得性能平滑升級。
May 12, 2026
330.6k
谷歌警告:黑客首次利用 AI 開發 “零日” 漏洞攻擊工具
谷歌安全團隊首次發現黑客利用AI技術開發出可繞過主流管理軟件的攻擊工具,該工具利用“零日”漏洞實施攻擊。此類漏洞因開發商未發現而無法提前修復,引發對網絡安全新威脅的廣泛關注。
May 12, 2026
149.8k
M4 MacBook Pro 性能實測:24GB 內存挑戰本地 AI 極限
蘋果M4芯片普及推動本地AI發展,開發者jola在24GB內存的M4 MacBook Pro上成功部署本地AI工作流。測試顯示,優化後的Qwen 3.5-9B模型生成速度達每秒40 tokens,爲離線辦公和私密開發提供高效方案。選型上,9B模型被認爲是本地運行大語言模型的最優解,平衡了性能與資源需求。
May 11, 2026
227.6k
押注於人而非代碼:Zig 項目全面禁止 LLM 輔助貢獻引發熱議
生成式AI席捲編程領域之際,Zig開源項目逆勢推出嚴格政策:全面禁止使用大語言模型生成的代碼或評論參與貢獻。知名開發者Simon Willison解讀後,引發社區對技術效率與人才培養博弈的討論。核心矛盾在於代碼產出與人才成長的取捨,Zig維護者重新定義“貢獻”,強調原創與學習過程。
Apr 30, 2026
431.9k
