最近,一家名爲MultiOn的初創公司發佈了一款名爲Agent Q的智能體,號稱在真實任務中達到了驚人的95.4%成功率,引起了廣泛關注。

而更引人注目的是,MultiOn的CEO Div Garg在推特上頻頻使用草莓表情,讓人不禁聯想到OpenAI神祕的Q項目。

image.png

網友們對Agent Q背後的技術充滿了好奇。有人猜測,這背後可能有OpenAI的Q*項目加持。MultiOn公司不僅給Agent Q開設了獨立的推特賬號,而且賬號的背景圖片和基本信息都與草莓有關,這無疑增加了人們對其背後技術的好奇。

image.png

Agent Q結合了搜索、自我反思和強化學習,能夠進行規劃和自我修復。它通過引入一種新的學習和推理框架,解決了之前LLM訓練技術的侷限性,使其能夠實現自主網頁導航。

在模擬網上商店的任務中,Agent Q展現了強大的搜索能力。而在Open Table的真實預訂任務中,Agent Q更是將LLaMa-3的零樣本成功率從18.6%提升至81.7%,分數提高比例達340%,而且僅經過了一天的自主數據收集。

image.png

雖然Agent Q在評估實驗中表現出色,但目前所用的方法仍存在許多討論和改進的空間。例如,推理算法的設計、搜索策略的選擇以及在線安全與交互等方面都需要進一步研究和優化。

Agent Q的出現無疑是AI智能體領域的一大進步,但它是否能夠成爲AI界的新貴,還是僅僅是一次高明的炒作,還有待時間的檢驗。無論如何,Agent Q的發佈都爲AI的發展帶來了新的可能性和啓示。

參考資料:


https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities