騰訊的研究者們發現,大語言模型的性能會隨着實例化agent數量的增加而增強,無需複雜的多LLM agents協作框架。實驗結果顯示多個小LM集成可以超越較大LM的性能。論文探討了性能提升與問題難度之間的關係,並提出了逐步採樣和投票、分層採樣和投票兩種優化策略。