最近、NVIDIAと香港大学の研究者らは、「Orchestrator」という新しいモデルを発表しました。このモデルは80億パラメータを持ち、異なるツールや大規模言語モデル(LLM)を調整して複雑な問題を解決する能力があります。実験では、Orchestratorはツール使用のベンチマークテストでより低コストで高い正確性を達成し、ユーザーの好みに応じて適切なツールを選択する知能的な能力を備えています。

image.png

Orchestratorのトレーニングは、新しい強化学習フレームワーク「ToolOrchestra」を通じて行われました。このフレームワークは、小さなモデルを知能的な調整者として育てることが目的です。このアプローチの中心的な考え方は、軽量な「調整者」が多様な専門モデルとツールを管理し、単一の巨大なAIシステムよりも効率的に問題を解決できるというものです。

現在、多くの大規模言語モデルツールは、基本的なツール(インターネット検索や電卓など)と強力なモデルを組み合わせる方法を使っています。研究者らは、実際には人間が自身の知能を超えたリソースを呼び出すため、LLMsもさまざまなツールと対話できるべきだと考えています。そのため、彼らは単一のモデルシステムから複数のモデルで構成される複合システムへの移行を提案しています。調整者は複雑なタスクを分析し、サブタスクに分解し、必要に応じて適切なツールを呼び出します。

ToolOrchestraフレームワークを通じて、研究チームはOrchestratorモデルをトレーニングし、その性能を3つの課題のあるベンチマークで評価しました。いくつかの大規模な汎用モデルと比較した結果、博士レベルの問題を扱うベンチマーク「HLE」において、Orchestratorは顕著な優位性を示し、他の方法よりも計算コストがはるかに低いことが分かりました。特にツールを呼び出す際に、Orchestratorは異なるツールの使用を効果的に計画し、効率を保ちながら高コストモデルの呼び出しを減らすことができます。

研究者らは、強化学習によって訓練されたOrchestratorが非常に高い汎用的推論能力を示しており、新規な挑戦に柔軟に対応できることを述べています。企業向けの応用においては、Orchestratorは未経験のモデルや料金構造に適応でき、多様なAIモデルに依存する企業に対してより経済的かつ柔軟なソリューションを提供します。

プロジェクト: https://research.nvidia.com/labs/lpr/ToolOrchestra/

ポイント:

🌟 Orchestratorは80億パラメータを持つモデルであり、さまざまなツールをスマートに調整し、AIの推論能力を向上させます。

💡 ToolOrchestraフレームワークは強化学習により小規模なモデルを訓練し、複雑なタスクをより効率的に管理します。

🚀 Orchestratorは複数のベンチマークテストで優れたパフォーマンスを発揮し、計算コストを大幅に削減し、多様な企業ニーズに対応できます。