正文

數學能力超 ChatGPT，70B 開源大模型火了：用 AI 微調 AI，微軟全華班出品

發布於AI新閒資訊

時間 :Aug 14, 2023

閱讀 :1分鐘

微軟全華班開發的 WizardMath 模型是一個 70B 的開源大模型，利用 AI 生成的指令對大模型進行微調，使其在數學能力上超過了 ChatGPT、Claude Instant 1、PaLM 2-540B 等一衆大模型。WizardMath 模型的開源代碼和論文已在 GitHub 上發佈，受到了學術界和開發者的廣泛關注。該模型的方法使用了 Evil Instruction 技術，通過自動生成涵蓋各種難度級別的開放域指令，進而提升大模型的處理能力。作者還基於該方法開發了其他領域的模型，如 WizardCoder 專注於代碼能力。該研究團隊由多位全華人科學家組成，包括來自微軟亞洲互聯網工程院和 Microsoft Research 的研究人員。

指標驚豔卻遭社區聲討？MiniMax新旗艦模型M3 引發兩極分化爭議

AI初創公司MiniMax發佈旗艦大模型M3，性能驚豔：在接近真實軟件工程場景的測試中取得59%成績，超越GPT-5.5，逼近Opus4.7，具備百萬級上下文處理能力和原生多模態特性，但發佈後引發爭議。

Jun 3, 2026

127.3k

大模型如何真正告別幻覺？元認知或是破局的關鍵

大模型“幻覺”問題（輸出事實性錯誤）在醫療、法律等高危領域尤爲嚴重。業界對抗幻覺的兩大主流方法——擴大訓練數據與設置防禦機制——均有侷限：數據無法覆蓋所有事實，防禦機制則常導致AI過度謹慎。

Jun 3, 2026

121.7k

最高狂降97.5%！騰訊雲大模型全面降價，徹底持平官方原廠價

騰訊雲智能體開發平臺宣佈自6月3日起，對DeepSeek V4系列大模型進行大幅降價，其中主力模型DeepSeek-V4-Pro的推理輸入和輸出價格均降低75%，旨在降低企業與開發者的創新門檻，減少日常調用成本。

Jun 2, 2026

201.3k

OpenAI官宣進軍機器人賽道，獨立組建團隊押注具身智能

OpenAI宣佈成立Robotics事業部，將AI從軟件拓展至具身智能領域，旨在通過大模型連接物理世界。CEO山姆·奧特曼公開招募全棧硬件、運營、系統及機器學習工程師，強調AI應切實幫助人類生活。團隊計劃分階段推進，短期內專注研發，以逐步實現現實世界應用。

Jun 2, 2026

179.8k

大廠速度！京東雲首發上線MiniMax M3 大模型，推理效率迎跨越式升級

MiniMax M3模型正式發佈，京東雲JoyBuilder平臺同步接入並開放服務。核心亮點是推理性能大幅提升，通過自研推理框架結合PD分離部署、KV Cache緩存及投機採樣等優化技術，實現更高效的實際運行效果。

Jun 2, 2026

149.9k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

數學能力超 ChatGPT，70B 開源大模型火了：用 AI 微調 AI，微軟全華班出品

相關推薦

指標驚豔卻遭社區聲討？MiniMax新旗艦模型M3 引發兩極分化爭議

大模型如何真正告別幻覺？元認知或是破局的關鍵

最高狂降97.5%！騰訊雲大模型全面降價，徹底持平官方原廠價

​OpenAI官宣進軍機器人賽道，獨立組建團隊押注具身智能

大廠速度！京東雲首發上線MiniMax M3 大模型，推理效率迎跨越式升級

OpenAI官宣進軍機器人賽道，獨立組建團隊押注具身智能