近日,夸克正式發佈健康大模型技術報告《QuarkMed Technical Report》,首次公開了“主任醫師級”能力的技術實現細節。

QuarkMed Technical Report
此前,夸克健康大模型成功通過了中國12門核心學科的主任醫師筆試評測,成爲國內首個完成這一挑戰的大模型。在與通用模型對比中,夸克健康大模型呈現出“難度越高、領先優勢越明顯”的性能曲線,尤其是在複雜醫學推理任務中實現突破。本次技術報告系統披露了這一突破背後的關鍵路徑與技術亮點。
面對醫療模型需要高質量、高專業度訓練數據的問題,夸克健康大模型在模型訓練不同階段,使用了三類核心醫療數據:醫學資料、醫學知識和醫療記錄,數據總量高達約1萬億Token。這些專業數據能有效彌補預訓練語料庫的不足,有助於提高模型的準確性與推理能力。

醫療數據源分類及規模
爲提升模型正確性、安全性以及複雜推理能力,夸克健康大模型引入兩個強化學習(RL)階段。第一階段通過大規模醫學強化學習,提升大模型在複雜場景中的推理能力。第二階段通過設計獎勵模型,從誠實性、有用性、內容合規性三個角度評估模型輸出質量、調整模型行爲,使其符合人類偏好和價值觀。

訓練期間,針對一般任務和推理任務使用三種類型的獎勵信號
技術報告同時還公佈了多個性能測試結果。在MedQA等多個國際權威數據集測試中,夸克健康大模型相比o3-mini等同尺寸模型表現出了更優異的性能。在中國醫師資格考試(CPQExam)筆試評測中,筆試難度越高,夸克健康大模型領先優勢越明顯。

CPQExam測試結果
報告中透露,夸克計劃將醫師考試測試集全面公開,以促進醫學相關的AI研究。
附訪問與下載地址:
https://arxiv.org/pdf/2508.11894
https://github.com/Quark-Medical/QuarkMed/blob/main/report/QuarkMed_Technical_Report.pdf
