スタンフォード大学は人工知能分野で再び大きな進歩を遂げ、新たに開発したSTORM&Co-STORMシステムをオープンソース化しました。このシステムは、シンプルなテーマを入力するだけで、多様な情報源を統合し、高品質の長文を生成できます。この革新的なシステムは、情報の盲点を回避するだけでなく、研究論文の執筆効率と質を大幅に向上させます。
STORM&Co-STORMシステムの中核技術には、Bing検索とGPT-4o miniのサポートが含まれています。STORM部分は、「LLM専門家」と「LLM司会者」間の多角的な質疑応答を通じて、反復的にアウトライン、段落、そして論文を生成します。一方、Co-STORMは、複数のエージェント間の対話によってインタラクティブな動的なマインドマップを生成し、ユーザーが見落としている可能性のある情報ニーズを見逃さないようにします。
ユーザーは英語のテーマワードを入力するだけで、多様な情報源を統合した高品質の長文を生成できます。これは、ウィキペディアの記事のようなものです。STORMシステムを使用する際には、STORMモードとCo-STORMモードを自由に選択できます。テーマを指定すると、STORMは3分以内に構造化された高品質の長文を作成します。
さらに、「See BrainSTORMing Process」をクリックすることで、様々なLLM役割によるブレインストーミングのプロセスを確認できます。「発見」欄では、他の研究者が作成した論文やチャットの例を参照でき、自分が作成した論文やチャットの記録は、サイドバーの「My Library」で確認できます。
STORMシステムの自動執筆プロセスは、多角的な質問生成、アウトライン生成と改良、全文生成の3つの段階に分かれています。システムは関連するウィキペディアの記事を参照して、そのテーマを網羅する様々な視点を特定し、その後、ウィキペディアの執筆者と信頼できるオンライン情報源に基づいた専門家の間の対話をシミュレートします。LLMの固有の知識に基づいて、異なる視点から収集された対話内容を最終的に精巧に構成し、執筆アウトラインを作成します。
STORMは、特定のテーマを調査する際に異なる視点を見つけることができますが、収集された情報は依然としてインターネットの主流の情報源に偏っている可能性があり、宣伝内容が含まれている可能性もあります。研究のもう一つの限界は、研究者がウィキペディアの記事のようなものをゼロから生成することに重点を置いていますが、自由に構成されたテキストの生成のみを考慮していることです。一方、高品質なウィキペディアの記事を手作業で作成する際には、通常、構造化データとマルチモーダル情報が含まれています。
Co-STORMは、情報収集と統合における情報の欠落の問題を改善し、学習効率を大幅に向上させることを目的としています。複数のエージェントによる協調的な対話、動的なマインドマップ、レポート生成モジュールを通じて、ユーザーは情報の整理を理解し、参加することができます。研究者たちは20人のボランティアを対象に人間の評価を行い、Co-STORMと従来の検索エンジン、RAGチャットボットのパフォーマンスを比較しました。その結果、Co-STORMは情報の深さと広さを著しく向上させ、70%のユーザーがCo-STORMを好み、認知的負荷が大幅に軽減されたと評価しました。
現在、STORM&Co-STORMシステムは英語でのみインタラクションをサポートしていますが、将来的には多言語対応を拡大する可能性があります。このシステムのオープンソース化は、情報取得方法が個人のレベルに合わせて完全にカスタマイズできる素晴らしい時代に生きていることを示しており、あらゆるものを学ぶことが可能になります。