7月23日消息,夸克健康大模型成功通過中國12門核心學科的主任醫師筆試評測,成爲國內首個完成這一挑戰的大模型。目前,“主任級 AI 醫生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問題時,選擇深度搜索即可調用。
這是繼5月通過副主任醫師職稱考試後,夸克健康大模型能力的又一次躍升。在垂類模型與通用模型對比中,夸克健康大模型呈現出難度越高、領先優勢越明顯的性能曲線,展現出在複雜醫學推理任務中的突破。
這揭示了在醫學領域研發垂類模型的巨大潛力。夸克健康大模型以通義千問爲基礎,走出了一條面向垂直場景的深度工程化路線。“我們不是在訓練AI回答醫學問題,而是在訓練它學會醫學思維”,夸克健康算法負責人徐健說。
夸克健康大模型的核心突破之一,是構建出“慢思考能力”。該能力融合了鏈式推理與多階段臨牀演繹路徑建模,驅動模型在面對複雜醫療問題時,能夠分階段、層層深入地推導出最終回答。
構建慢思考能力的前提,是擁有高質量推理訓練數據。爲此,夸克構建了“雙數據產線 + 雙獎勵機制”的工程體系。一方面,將醫學數據劃分爲“可驗證”和“不可驗證”兩類,分別對應診斷類任務和健康建議類任務;另一方面,在訓練方法上引入“過程獎勵模型”和“結果獎勵模型”,分別評估模型推理鏈的合理性與最終結論的準確性,顯著提升模型的臨牀可解釋性和推理一致性。
該體系還設計了多階段強化學習流程,包括冷啓動數據的嚴格人工校驗、多輪樣本篩選與難度遞進訓練策略,以及用於防止“高分投機”的作弊識別機制。通過真實醫生標註、“問—思—答”整組數據驅動強化學習,夸克健康大模型不僅學會了醫學知識,更掌握了醫學思維的路徑選擇、證據整合與多解平衡能力。底層的權威醫學知識庫確保了模型輸出內容專業、及時。
安貞醫院心臟外科主任醫師謝進生認爲,夸克在一些問題上回答專業度比專業醫生還要強。這一成果背後是專業醫師團隊的深度參與。目前,夸克健康大模型擁有千人規模的專業醫師標註團隊,其中超過400名均爲副主任醫師及以上的高資歷醫療專家。
憑藉在醫學領域的專業性,夸克AI搜索吸引了一大批醫學生和醫生羣體。夸克健康運營負責人趙存忠介紹,目前平臺在全國醫學生中月活用戶已突破200萬,覆蓋率過半,他們廣泛使用夸克用於基礎知識搜索、考試備考和臨牀輔助診療。