OpenAI 正式發佈了一個大型數據集,旨在評估大型語言模型在醫療健康領域回答問題的能力。這一項目被命名爲 HealthBench,專家們對這一開源數據和詳細的評估標準給予了高度讚譽,稱其在規模和廣度上都是 “前所未有” 的。

AI 醫療 (2)

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

HealthBench 項目標誌着 OpenAI 在醫療健康領域的首次嘗試,尤其是在不依賴外部合作伙伴的情況下進行的創新探索。OpenAI 的健康 AI 團隊負責人卡蘭・辛格爾(Karan Singhal)表示:“我們的使命是確保人工通用智能(AGI)對人類有益。” 他指出,除了開發和部署技術,確保如醫療健康這樣的正面應用能夠健康發展也同樣重要。他強調,OpenAI 會致力於確保這些模型在醫療環境中的安全性和可靠性。

此次發佈的數據集涵蓋了大量與醫療相關的問題及其答案,旨在幫助研究人員和開發者更好地評估和優化 AI 模型在實際醫療場景中的應用。這種全面的評估方法,有助於推動醫療 AI 技術的進步和完善,進而提升醫療服務的效率和安全性。

OpenAI 的這一新舉措不僅展示了其在技術創新上的雄心,還表明了其對改善醫療健康領域的關注。通過提供開放的數據集和評估工具,OpenAI 希望能夠吸引更多的研究者和開發者參與到醫療 AI 的開發與應用中來,共同推動醫療技術的進步。

劃重點:  

🌟 OpenAI 發佈了名爲 HealthBench 的健康領域評估數據集,評估 AI 模型在醫療問題上的回答能力。  

💡 專家稱該數據集在規模和評估標準上是前所未有的,具有重要的開創性。  

🏥 該項目標誌着 OpenAI 首次獨立進軍醫療領域,致力於確保 AI 在健康應用中的安全性和可靠性。