近日,百川大模型正式發佈了其最新的醫療大模型 ——Baichuan-M2Plus,並同步升級了配套應用百小應,開放了 API 接口。這一發布標誌着百川在推出開源模型 Baichuan-M2後的又一重要進展。
通過一系列評測,M2Plus 在醫療幻覺率方面表現優異,較通用大模型顯著降低,尤其在與現有醫療產品 DeepSeek 的比較中,幻覺率降低了約3倍,甚至超過了美國流行的醫療應用 OpenEvidence。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
M2Plus 採用了六源循證推理(EAR)範式,成爲被譽爲 “醫生版 ChatGPT” 的智能助手。該模型針對嚴肅醫療場景中的應用難題,整合了原始研究、證據綜述、指南規範、實踐知識、公共健康教育以及監管的真實世界信息,構建了完整的醫學知識體系,確保醫療決策的可信性和科學性。
在循證檢索方面,M2Plus 利用 PICO 框架,將醫療查詢轉化爲結構化問題,確保檢索到的信息既精準又可靠。該模型的設計使得醫生在面對複雜的醫療問題時,能夠獲得高等級、可信的醫學證據,大幅提升醫療信息的使用效率。
更值得關注的是,M2Plus 在回答醫療問題時採用了 “循證增強訓練” 機制,確保模型的回答不僅基於檢索到的證據,還能有效避免隨意生成信息的情況。通過強化引用權威資料並評估證據質量,M2Plus 展現出與資深臨牀專家相當的可信度。
在多次醫療場景的測試中,M2Plus 獲得了臨牀醫生的高度評價,尤其在分析病史、診斷思路和治療方案時,其回答的準確性和專業性得到了廣泛認可。此外,在美國執業醫師資格考試(USMLE)中,M2Plus 取得了驚人的97分的佳績,進一步證明了其在醫療領域的應用潛力。
劃重點:
🌟 M2Plus 模型發佈,顯著降低醫療幻覺率,超越多款現有醫療產品。
🔍 採用六源循證推理(EAR)範式,確保醫療決策的科學性和可信性。
🏆 在 USMLE 考試中取得97分,顯示出卓越的醫療專業能力。
