近日,谷歌研究院、谷歌 DeepMind 與麻省理工學院聯合發佈了一項研究,挑戰了 “更多智能體意味着更好結果” 的傳統觀點。研究團隊通過180項控制實驗,探討了多智能體系統在不同任務中的表現,結果顯示性能波動極大,有的任務提升達到81%,而有的任務則下降了70%。

研究表明,任務的類型對多智能體系統的效果有顯著影響。在一些並行任務中,例如金融分析,採用集中式的多智能體協調能夠顯著提升性能。不同的智能體能夠獨立分析銷售趨勢、成本結構和市場數據,然後將結果彙總,最終實現了近81% 的性能提升。

然而,在一些需要順序進行的任務中,如 Minecraft 的規劃任務,多智能體的設置反而會使性能下降39% 到70%。這是因爲每個製作動作都會影響到後續動作所依賴的庫存狀態,任務之間的順序依賴性使得信息在智能體之間傳遞時可能會丟失或被分割。

研究發現,影響多智能體系統性能的主要因素有三個:首先,任務涉及的工具越多,像網絡搜索或編碼等任務就越容易受到多智能體系統的負面影響。其次,當單個智能體的成功率超過45% 時,添加更多智能體通常會導致收益遞減或負收益,協調成本會抵消增益。最後,錯誤的累積在多智能體環境中會加速,缺乏信息共享的情況下,錯誤會比單個智能體環境中快17倍。

劃重點:

🌟 多智能體系統在並行任務中表現優異,但在順序任務中卻會顯著降低效率。

🤖 當單個智能體的成功率超過45% 時,採用多智能體系統可能並不划算。

🔧 任務涉及的工具越多,多智能體系統的協調成本就越高,影響性能。