數學能力超 ChatGPT,70B 開源大模型火了:用 AI 微調 AI,微軟全華班出品

發布於AI新閒資訊
時間 :Aug 14, 2023
閱讀 :1分鐘
微軟全華班開發的 WizardMath 模型是一個 70B 的開源大模型,利用 AI 生成的指令對大模型進行微調,使其在數學能力上超過了 ChatGPT、Claude Instant 1、PaLM 2-540B 等一衆大模型。WizardMath 模型的開源代碼和論文已在 GitHub 上發佈,受到了學術界和開發者的廣泛關注。該模型的方法使用了 Evil Instruction 技術,通過自動生成涵蓋各種難度級別的開放域指令,進而提升大模型的處理能力。作者還基於該方法開發了其他領域的模型,如 WizardCoder 專注於代碼能力。該研究團隊由多位全華人科學家組成,包括來自微軟亞洲互聯網工程院和 Microsoft Research 的研究人員。