このたび、百川は最新の医療大規模モデル「Baichuan-M2Plus」を正式に発表し、それに伴うアプリケーション「百小应」もアップグレードし、APIインターフェースを開放しました。このリリースは、百川がオープンソースモデル「Baichuan-M2」を発表した以来の重要な進展です。

いくつかの評価テストにおいて、M2Plusは医療に関する誤った情報(幻覚)の割合が優れた性能を示し、一般的な大規模モデルと比較して顕著に低下しています。特に、既存の医療製品であるDeepSeekとの比較では、幻覚率が約3倍低下し、アメリカで人気のある医療アプリケーションOpenEvidenceを上回っています。

MRI 医療 (1)

図の出典:画像はAIによって生成され、画像ライセンス提供元はMidjourneyです。

M2Plusは六源循証推論(EAR)フレームワークを採用しており、「医師版ChatGPT」として知られるスマートアシスタントとなっています。このモデルは、重大な医療シーンにおける応用問題に対処するため、元の研究、証拠の総合、ガイドライン、実践知識、公衆衛生教育および規制の現実的な情報を統合し、完全な医学知識体系を構築し、医療決定の信頼性と科学性を確保しています。

証拠に基づく検索において、M2PlusはPICOフレームワークを使用して医療質問を構造化された問題に変換し、得られた情報が正確かつ信頼できるようにしています。このモデルの設計により、医師が複雑な医療問題に直面した際、高品質で信頼できる医学的証拠を得ることができ、医療情報の使用効率を大幅に向上させます。

さらに注目すべきは、M2Plusが医療質問に回答する際に「証拠強化トレーニング」メカニズムを採用していることで、モデルの回答が検索された証拠に基づきつつ、無作為に情報を生成することを効果的に回避している点です。権威ある資料の引用と証拠の品質の評価を通じて、M2Plusは熟練した臨床専門家と同等の信頼性を示しています。

多数の医療シーンでのテストにおいて、M2Plusは臨床医から高い評価を受けました。特に、病歴の分析や診断の考え方、治療計画に関して、その回答の正確さと専門性が広く認められています。また、米国の医師資格試験(USMLE)において、M2Plusは驚くべき97点という成績を収め、医療分野での応用可能性をさらに証明しています。

ポイント:

🌟 M2Plusモデルのリリースにより、医療の幻覚率が顕著に低下し、多くの既存の医療製品を上回りました。

🔍 六源循証推論(EAR)フレームワークを採用し、医療決定の科学性と信頼性を確保しています。

🏆 USMLE試験で97点を取得し、卓越した医療専門能力を示しています。