近日,百川大模型正式發佈了其最新的醫療大模型 ——Baichuan-M2Plus,並同步升級了配套應用百小應,開放 API 接口。這一發布標誌着百自8月份開源 Baichuan-M2以來的又一重要進展。通過評測,M2Plus 在醫療幻覺率方面表現出色,較通用大模型顯著降低,尤其是相比現有的醫療產品 DeepSeek,幻覺率降低了約3倍,甚至超越了美國廣受歡迎的醫療應用 OpenEvidence。

M2Plus 以其創新的六源循證推理(EAR)範式,成爲了 “醫生版 ChatGPT”。該模型針對嚴肅醫療場景中的應用難題,通過整合原始研究、證據綜述、指南規範、實踐知識、公共健康教育及監管真實世界信息,構建了完整的醫學知識體系,確保了醫療決策的可信性和科學性。
在循證檢索方面,M2Plus 採用 PICO 框架,將醫療查詢轉化爲結構化問題,確保檢索到的信息精準可靠。該模型的獨特設計還允許醫生在面對複雜的醫療問題時,獲取到高等級、可信的醫學證據,大幅提升了醫療信息的使用效率。
更爲重要的是,M2Plus 在回答醫療問題時的 “循證增強訓練” 機制,使得模型的回答不僅基於檢索到的證據,而是有效避免了隨意生成信息的情況。通過強化引用權威資料並評估證據質量,M2Plus 在實際應用中展現出與資深臨牀專家相當的可信度。

在醫療場景的多次測試中,M2Plus 的表現得到了臨牀醫生的高度評價,尤其是在分析病史、診斷思路和治療方案時,其回答準確性和專業性得到了廣泛認可。更令人矚目的是,在美國執業醫師資格考試(USMLE)中,M2Plus 取得了驚人的97分的佳績,顯示出其在醫學知識運用能力上的超越。
百川大模型的發佈不僅爲中國醫療行業的數字化轉型注入了新動能,更代表了中國在全球大模型領域的進一步突破。隨着 M2Plus 的推出,預計將對提高臨牀決策的科學性和有效性產生深遠的影響。
