微軟在其官網上正式開源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。這一新模型在保留原有推理性能的基礎上,進行了顯著的增強,尤其在對敏感話題的響應能力上取得了巨大的突破。
MAI-DS-R1的響應能力達到了99.3%,是原版 R1的兩倍多。這一進步將對政治學、社會問題以及倫理道德的研究提供極大的支持。儘管其響應了更多的敏感話題,但在安全風險方面,MAI-DS-R1的有害內容降低了50%,展現出良好的安全控制能力。因此,渴望體驗 “放飛自我” 版的用戶可以嘗試這一模型,探索新的可能性。
在模型的訓練過程中,微軟收集了約350,000個被屏蔽的主題示例,並篩選出相關的查詢關鍵詞。這些關鍵詞被轉化爲多個問題並翻譯成不同語言,進一步提升了模型的多語言適應性。此外,微軟利用 DeepSeek R1及內部模型生成了相關問題的答案和思維鏈。訓練數據還包括來自 Tulu3SFT 數據集的110,000個安全和違規示例,確保了模型在多種情況下的有效性。
經過全面評估,MAI-DS-R1在敏感話題的響應能力上表現出色,遠超 DeepSeek R1及其衍生版本。在安全性評估中,MAI-DS-R1在 HarmBench 測試中表現不俗,顯示出能夠有效減少有害內容的能力,確保安全性和響應能力之間的良好平衡。
在推理能力方面,MAI-DS-R1與 DeepSeek R1保持一致,在常識、推理、數學和編程的基準測試中均表現優異。與此同時,該模型在處理不合法或不道德的請求時更加謹慎,拒絕生成任何有害或不當內容。
此外,MAI-DS-R1在後續的訓練過程中將問題翻譯成多種語言,使其能更好地滿足國際組織、跨國企業及教育機構等多語言需求的場景。微軟已在 huggingface 開源了該模型,並在 Azure AI Foundry 進行了發佈,爲廣大用戶提供了更多的選擇。
huggingface:https://huggingface.co/microsoft/MAI-DS-R1
Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml
劃重點:
🌟 MAI-DS-R1的敏感話題響應能力提升至99.3%,是原版 R1的兩倍多。
🔒 安全風險大幅降低,有害內容減少50%,確保使用安全。
🌍 多語言支持能力強,更適應國際組織和跨國企業的需求。