正文

夸克發佈健康大模型技術報告，公開AI“主任醫師”技術細節

發布於AI新閒資訊

時間 :Aug 25, 2025

閱讀 :1分鐘

近日，夸克正式發佈健康大模型技術報告《QuarkMed Technical Report》，首次公開了“主任醫師級”能力的技術實現細節。

QuarkMed Technical Report

此前，夸克健康大模型成功通過了中國12門核心學科的主任醫師筆試評測，成爲國內首個完成這一挑戰的大模型。在與通用模型對比中，夸克健康大模型呈現出“難度越高、領先優勢越明顯”的性能曲線，尤其是在複雜醫學推理任務中實現突破。本次技術報告系統披露了這一突破背後的關鍵路徑與技術亮點。

面對醫療模型需要高質量、高專業度訓練數據的問題，夸克健康大模型在模型訓練不同階段，使用了三類核心醫療數據:醫學資料、醫學知識和醫療記錄，數據總量高達約1萬億Token。這些專業數據能有效彌補預訓練語料庫的不足，有助於提高模型的準確性與推理能力。

醫療數據源分類及規模

爲提升模型正確性、安全性以及複雜推理能力，夸克健康大模型引入兩個強化學習（RL）階段。第一階段通過大規模醫學強化學習，提升大模型在複雜場景中的推理能力。第二階段通過設計獎勵模型，從誠實性、有用性、內容合規性三個角度評估模型輸出質量、調整模型行爲，使其符合人類偏好和價值觀。

訓練期間，針對一般任務和推理任務使用三種類型的獎勵信號

技術報告同時還公佈了多個性能測試結果。在MedQA等多個國際權威數據集測試中，夸克健康大模型相比o3-mini等同尺寸模型表現出了更優異的性能。在中國醫師資格考試（CPQExam）筆試評測中，筆試難度越高，夸克健康大模型領先優勢越明顯。

CPQExam測試結果

報告中透露，夸克計劃將醫師考試測試集全面公開，以促進醫學相關的AI研究。

附訪問與下載地址:

https://arxiv.org/pdf/2508.11894

https://github.com/Quark-Medical/QuarkMed/blob/main/report/QuarkMed_Technical_Report.pdf

DeepSeek V4 正式版疑定檔 8 月 3 日：硅基流動漲價露馬腳，API 已能答對新題

DeepSeek V4正式版自7月中旬灰度測試後一度跳票，官方至今未公佈發佈時間。但硅基流動平臺通知自8月3日起，將DeepSeek V4 Pro的緩存命中價格從每百萬Token 0.1元大幅上調至1.0元。這一突兀漲價被外界視爲DeepSeek V4正式版即將上線的重要信號，8月3日或成爲發佈節點。

Jul 31, 2026

283.8k