人工知能の分野において、特に大規模言語モデル(LLM)の応用では、正確性が常に注目されてきました。LLMが複雑な質問に対してより良いパフォーマンスを発揮するためには、検索増強生成(RAG)技術が登場しました。この技術は、質問に答える前に知識ベースから関連情報を検索し、より正確で根拠のある回答を生成することを可能にします。しかし、RAG技術にもいくつかの欠点があり、特に人間の言語の多様性に対処する際には問題があります。このような課題を解決するために、Lexical Diversity-aware RAG(DRAG)が登場しました。

image.png

DRAG技術は、RAGの弱点、特に検索と生成の段階で、細かい分析と柔軟な調整を通じて正確性を向上させます。検索段階では、DRAGは「多様性感知関連性分析器」(DRA)を使用し、質問を3つのコンポーネントに分解します:変化しないコンポーネント、バリアントコンポーネント、補完コンポーネント。DRAは、それぞれのコンポーネントの特性に基づいて関連性評価基準を設定し、質問のコア内容に関連性が高いドキュメントを抽出します。

生成段階では、DRAGは「リスク誘導型スパース調整戦略」(RSC)を導入し、不要な情報がモデルによる回答に与える影響を軽減します。RSCは、各単語のリスクを評価し、ノイズの影響を受けやすい高リスクの単語に特に注目し、対象的な調整を行うことで、最終的に生成される結果の品質を向上させます。

これらの2つの革新により、DRAG技術は複雑な質問を処理する際の正確性が大幅に向上し、実際のテストでは、DRAGを使用したモデルの正確性は従来のRAGよりも45.5%も向上しています。この進展は、人工知能が自然言語の理解と生成において重要な一歩を踏み出したことを示しており、特に多様な言語表現に対面する際に、DRAGはより強力な能力を示しています。

DRAG技術がさらに発展していくにつれて、今後の人工知能モデルはより多くの応用シーンでより正確で信頼性の高い回答を提供できるようになるでしょう。

ポイント:  

📝 DRAG技術は質問のコンポーネントを細分化し、検索の正確性を向上させます。  

🔍 DRA分析器とRSC調整戦略は、不要な情報の干渉を共に低減します。  

🚀 DRAGを導入した後、モデルの正確性は45.5%向上しました。