シンガポールのスタートアップ企業であるSapient Intelligenceは、最近「階層的推論モデル」(HRM)と呼ばれる革新的な人工知能アーキテクチャをリリースしました。このモデルは、複雑な推論タスクにおいて既存の大規模言語モデル(LLM)と同等の性能を発揮し、場合によってはそれより優れている一方で、従来のモデルよりもはるかに少ないデータ量で、かつモデルサイズも小さくても済むという特徴があります。HRMの設計は人間の脳からインスピレーションを得ており、異なる思考システムを通じて効率的な推論を実現することを目指しています。

現在のLLMは一般的に、複雑な問題を解決するために「思考の連鎖(CoT)」という方法を採用しており、推論のために一連のテキストステップを生成します。このアプローチはモデルの推論能力をある程度向上させましたが、明らかに欠点もあります。研究者たちは、思考の連鎖法が手動で定義されたステップに依存しており、エラーが発生すると全体の推論プロセスに失敗を引き起こす可能性があると指摘しています。そのため、Sapient Intelligenceの研究チームは、「潜在的推論」という新しいアプローチを提案しました。この方法では、モデルが内部の抽象空間内で推論を行うことで、単にテキスト生成に頼るのではなく、独自の推論を行うことが可能です。
HRMは、2つの相互作用するモジュールで構成されています。一つは、遅く抽象的な計画を担当する高レベルモジュールであり、もう一つは高速で詳細な計算を担当する低レベルモジュールです。この階層的な設計により、HRMは大量の入力データに依存せずに深い推論を行うことができます。テスト結果によると、HRMは抽象的推論や複雑な数独などの高難易度タスクを処理する際、非常に優れた性能を示しており、複雑なタスクにおける強力な能力を証明しています。
正確性だけでなく、HRMは推論速度にも優れています。Sapient Intelligenceの創業者である王冠氏によると、特定の複雑な推論タスクを実行する際、HRMはタスク完了時間が100倍速くなると述べています。これは、HRMがエッジデバイス上で迅速かつ強力な推論計算を行うことができることを意味し、企業にとって時間とコストを大幅に削減することが可能になります。

将来に向けて、Sapient IntelligenceはHRMをより汎用的な推論ソリューションとして開発し、医療、気候予測、ロボティクスなど複数の分野に応用することを計画しています。この開発は、今後のAIの成功が単にモデルのサイズを拡大することにあるのではなく、人間の脳の構造からインスピレーションを得て、よりスマートで効率的な推論アーキテクチャを開発することにあることを示しています。
ポイント:
🚀 HRMは新たな階層型アーキテクチャにより、大規模言語モデルを超えて複雑な推論タスクに優れた性能を発揮し、必要なデータ量も少ない。
🔍 HRMのモデルは高レベルおよび低レベルモジュールを組み合わせており、推論速度と効率を向上させている。
💼 今後のAIは、単にモデルの規模を拡大するのではなく、人間の脳の設計からより多くのインスピレーションを得ることが重要になるかもしれない。
