マイクロソフトのCEOであるサティア・ナダラ氏は最近、ソーシャルメディアで、マイクロソフトが画期的な医療AIシステム「MAI-DxO」を正式にリリースしたことを発表しました。この革新性あるシステムは、特徴的な「モデルに依存しない」設計により注目されています。これは、異なるメーカーおよび能力を持つ言語モデルに柔軟に対応でき、診断性能を一般的に向上させることを可能にしています。さらに驚くべきことに、MAI-DxOは本物の医師の診断プロセスを模倣し、テストにおいて専門医よりも大幅に高い診断精度を示しており、医療診断コストも大幅に削減しています。

マイクロソフトが公開したテストデータによると、『ニューイングランド・ジャーナル・オブ・メディスン』の56件の隠しテストセットに対する比較では、10年以上の経験を持つ21人の専門医の平均診断精度はわずか19.9%でした。一方、MAI-DxOは予算なしの設定でOpenAIのo3モデルを使用した場合、精度は81.9%に達しました。統合モードではさらに驚くべき85.5%という高精度を記録し、これは専門医の精度の4倍以上です。

MAI-DxOの核心的なイノベーションは、リアルな医療チームの協力モデルをシミュレートすることにあります。複数の役割を持つ仮想医師が診断問題を共同で解決することで、診断精度とコスト効率の両面で顕著な進展を遂げています。この仮想医師チームには、鑑別診断リストの維持と更新を担当するDr. Hypothesisや、毎ラウンドで最も区別力のある検査を選択するDr. Test-Chooser、バイアスを識別し挑戦的な提案を行う監督者役のDr. Challenger、コスト意識を促進し検査計画を最適化するDr. Stewardship、そして裏方で品質管理を行い推論の一貫性を確保するDr. Checklistが含まれます。

異なる医療現場におけるコスト、効率、精度のニーズに対応するために、MAI-DxOは5つの統合モードを提供します。これらのモードは、初期症例概要のみに依存して迅速な初期診断を行うInstant Answerモード(緊急時や資源が限られた状況に適しています)から、質問のみで診断を行い、一次診療をシミュレートするQuestion OnlyモードBudgetedモードNo BudgetモードEnsembleモードまでをカバーしています。

MAI-DxOのリリースとともに、マイクロソフトは専門的な医療順次診断ベンチマークSDBenchもリリースしました。このインタラクティブな評価フレームワークは、『ニューイングランド・ジャーナル・オブ・メディスン』に掲載された304の難しい診断事例を段階的な診断シナリオに変換し、人間の医師とAIの順次診断能力を評価するための現実的な素材を提供します。SDBenchでは、「ゲートキーパー」と呼ばれるスマートエージェントが情報を取得するプロセスをシミュレートし、「ジャッジ」と呼ばれるエージェントが診断結果を臨床的に実質的な観点から多角的に総合評価し、同時にコストも評価指標として含めることで、医療AI診断の新たな業界標準を設定しています。