斯坦福大學在人工智能領域再次取得重大進展,他們最新開發的STORM&Co-STORM系統已經開源,這一系統能夠通過簡單的主題輸入,全面整合多源信息,生成高質量的長篇文章。這一創新不僅能夠避開信息盲點,還能大幅提升科研寫作的效率和質量。

STORM&Co-STORM系統的核心技術包括必應搜索和GPT-4o mini的支持。STORM部分通過“LLM專家”與“LLM主持人”之間的多角度問答,迭代式地生成提綱、段落和文章。而Co-STORM則通過多智能體之間的對話生成可交互的動態思維導圖,確保不遺漏用戶可能未注意到的信息需求。

image.png

用戶只需輸入英文主題詞,系統便能生成整合了多源信息的高質量長文,類似於維基百科的文章。體驗STORM系統,用戶可以自由選擇STORM和Co-STORM模式。給定主題後,STORM能在3分鐘內形成一篇結構化高質量長文。

此外,用戶還可以通過點擊“See BrainSTORMing Process”來查看不同LLM角色的頭腦風暴過程。在“發現”欄中,用戶可以參考其他學者生成的文章和聊天示例,個人生成的文章和聊天記錄也可以在側邊欄“My Library”中找到。

image.png

STORM系統的自動化寫作流程分爲三大階段:多視角問題生成、大綱生成與完善、全文生成。系統通過查閱相關的維基百科文章來確定涵蓋該主題的各種視角,然後模擬一場對話,一方是維基百科撰寫者,另一方是基於可靠網絡來源的專家。根據LLM的固有知識,從不同視角收集到的對話內容,最終精心編排寫作大綱。

image.png

儘管STORM在研究給定主題時發現了不同的視角,但收集的信息可能仍然傾向於互聯網的主流來源,並可能包含促銷內容。研究的另一個侷限性是,儘管研究者專注於從零開始生成類似維基百科文章,但他們也僅考慮生成自由組織的文本。而人工撰寫的高質量維基百科文章通常包含結構化數據和多模態信息。

Co-STORM旨在改善信息蒐集整合中的信息遺漏問題,以大幅促進學習效率。它通過多智能體協作對話、動態思維導圖和報告生成模塊,幫助用戶理解和參與信息的組織。研究者對20名志願者進行了人類評估,比較了Co-STORM與傳統搜索引擎和RAG Chatbot的表現。結果顯示,Co-STORM顯著提升了信息的深度和廣度,70%的用戶更喜歡Co-STORM,認爲其顯著減少了認知負擔。

目前,STORM&Co-STORM系統僅支持英語交互,未來可能會擴展至多語言交互能力。這一系統的開源,標誌着我們正生活在一個信息獲取方式可以完全根據個人水平量身定製的非凡時代,讓學習任何東西都成爲可能。

論文地址:https://www.arxiv.org/pdf/2408.15232