人工知能エージェント(AI Agents)が単純な質問応答のインタラクションから、複雑で多段階のタスクを自主的に実行できる「行動派」に進化する中、これらのインテリジェントなエージェントが現実世界で安定して動作することを確保する方法が業界の注目を集めている。最近、スタートアップ企業Patronus AIは、Bラウンドで5,000万ドルの資金調達を完了し、総額は7,000万ドルに達した。

Patronus AIは、Metaの前AI研究者Anand KannappanとRebecca Qianによって2023年に設立され、AIインテリジェントエージェント用の高精度な「デジタル世界」を構築するのが主な業務である。このメカニズムは、Waymoが自動運転車のために開発する仮想訓練シナリオに似ており、さまざまな珍しく複雑な極端な状況をシミュレーションし、AIインテリジェントエージェントに対して包括的なストレステストを行う。

現在のAI開発プロセスにおいて、モデル開発者はさまざまなベンチマークテストを利用してモデルのパフォーマンスを示すことが多いが、これらのスコアはAIが実際の複雑な作業を処理する能力を完全には表していない。インテリジェントエージェントがタスクを実行する際には、問題を真正に解決する代わりに「裏技」を探す傾向がある。Patronus AIはこれらの仮想デジタル環境を構築し、モデルが基本的なトレーニングを受けた後、強化学習テストを実施する。システムは成功したタスクの完了を繰り返し報酬し、あらゆる不正行為や誤りに対してペナルティを与えることで、モデルが不確実な現実世界のシナリオに直面しても堅牢さを維持できることを保証している。

現在、Patronus AIのサービスはソフトウェアエンジニアリングや金融分析などの分野をカバーしており、その顧客層はすべての先進的なAIラボおよび新興AIスタートアップに及んでいる。過去1年間で収益は15倍に成長した。Notable Capitalの取締役社長Glenn Solomonは、このような高精度なテスト環境に対する市場の需要がほぼ「供給不足」に近い状態であると指摘した。

現在、Patronus AIは検証可能なタスクのシナリオに焦点を当てているが、創業者のKannappanは、これはまだ始まりに過ぎないと語っている。彼らの目標はより複雑な環境を構築し、インテリジェントエージェントが長期間にわたる継続的な作業を行えるようにすることである。10時間、10日、あるいはそれ以上でも、その行動がコンプライアンスと正確性を保つことができるようになる予定だ。今回の資金調達はGreenfield Partnersがリードし、Notable Capital、Lightspeed、Datadog、Samsungなど多くの機関が参加しており、資本市場がこのAI「品質検査」分野に深い認識を示していることを示している。