崑崙萬維開源Skywork-OR1系列模型數學代碼能力出色

4月13日，崑崙萬維天工團隊宣佈推出全新升級的Skywork-OR1（Open Reasoner1）系列模型，這是繼2025年2月發佈首款中文邏輯推理大模型Skywork-o1之後的又一力作。該系列模型在同等參數規模下實現了業界領先的推理性能，進一步突破了大模型在邏輯理解與複雜任務求解方面的能力瓶頸。

此次開源的Skywork-OR1系列模型包括三款高性能模型:Skywork-OR1-Math-7B聚焦數學領域的專項模型，同時也具備較強的代碼能力;Skywork-OR1-7B-Preview融合數學與代碼能力，兼具通用性與專業性;Skywork-OR1-32B-Preview則是面向更高複雜度任務、具備更強推理能力的旗艦版本。

微信截圖_20250414084641.png

在競賽編程任務中，通用模型Skywork-OR1-7B-Preview與Skywork-OR1-32B-Preview在LiveCodeBench數據集上均取得了同等參數規模下的最優性能。Skywork-OR1-32B-Preview表現尤爲突出，其代碼生成與問題求解能力已接近DeepSeek-R1（參數規模高達671B），在大幅壓縮模型體量的同時實現了卓越的性價比，充分展現出天工團隊訓練策略的先進性。

Skywork-OR1系列模型的顯著性能突破離不開天工團隊在模型後訓練階段的長期自研積累與技術深耕。在數據選擇和預處理方面，Skywork-OR1構建了一個高質量數學和代碼數據集，用於強化學習以提升模型在數學和代碼領域的推理能力。團隊根據可驗證性、正確性與挑戰性三個標準進行初步數據篩選，剔除無法自動驗證的證明類題目、有誤題目和缺少unit test的代碼問題。在數據過濾方面，爲避免“全對”或“全錯”現象對策略學習無效，每道題進行了多輪採樣並驗證答案，並基於模型表現過濾難度極端的題目。

此外，Skywork-OR1採用了Group Relative Policy Optimization （GRPO）進行模型訓練，並引入了訓練時數據優化、訓練Pipeline優化、訓練時模型探索和訓練Loss優化等多項優化措施。

Skywork-OR1系列開源地址:https://github.com/SkyworkAI/Skywork-OR1

崑崙萬維天工開放平臺面向OpenAl API用戶推出“一鍵搬家計劃”

爲了助力開發者高效切換至國內大模型，崑崙萬維天工開放平臺（ https://model-platform.tiangong.cn/ ）第一時間面向OpenAl API用戶推出“一鍵搬家計劃”，並提供1.5億Tokens的API調用資源(包括天工2.0及天工3.0大模型)!開發者還將享受專屬的天工遷移服務技術支持。

馬斯克的 xAI被質疑使用“非法”發電機爲 Colossus 超算供電

據英國《衛報》報道，馬斯克的 xAI 公司在孟菲斯的超級計算機 “Colossus” 設施使用的發電機正面臨監管審查。該設施爲 xAI 的聊天機器人 Grok 提供計算能力，其建築面積相當於13個足球場，並計劃未來進一步擴展。然而，xAI 被指控使用約35臺便攜式甲烷氣體渦輪發電機，且未獲得相關使用許可。圖源備註：圖片由AI生成，圖片授權服務商Midjourney南方環境法中心近日公佈的空中圖像顯示，xAI 實際使用的發電機數量遠超過之前所稱的15臺。這些渦輪機的總功率高達420兆瓦，足以滿足一座城市的

字節跳動推出Seed-Thinking-v1.5:推理AI競賽中的新力量

字節跳動加入了快速發展的AI推理模型競爭，推出了專注於科學、技術、數學和工程（STEM）領域的新型大語言模型Seed-Thinking-v1.5。這款採用混合專家(MoE)架構的模型在多項基準測試中表現優異，甚至在某些指標上超越了行業巨頭的產品。推理AI的演進歷程推理AI競賽始於2024年9月OpenAI的o1模型發佈，而後在2025年1月DeepSeek R1的推出後真正加速。如今，主要AI企業都在競相開發能夠執行"思路鏈"推理的模型，以提供更全面、更合理的回答。Seed-Thinking-v1.5採用了流行的混合專家（MoE）架構，類似於Me

OpenAI 推出 “經驗證的組織” 流程，強化 AI 模型使用安全

近日，OpenAI 在其官方網站發佈了一則重要消息，宣佈將推出名爲 “經驗證的組織”（Verified Organization）的身份驗證流程。這一新規要求希望使用某些先進 AI 模型的組織，必須先提供由政府頒發的身份證明文件，以確保其身份的真實性。此舉旨在增強人工智能的安全使用，防止其被不當使用。根據 OpenAI 的說明，驗證流程將幫助開發者更好地訪問其平臺上最先進的模型和功能。每個身份證明文件的有效期爲90天，每個組織只能在此期間進行一次驗證。此外，並非所有組織都有資格進行驗證，

崑崙萬維開源Skywork-OR1系列模型數學代碼能力出色

相關推薦

崑崙萬維天工開放平臺面向OpenAl API用戶推出“一鍵搬家計劃”

馬斯克的 xAI被質疑使用“非法”發電機爲 Colossus 超算供電

字節跳動推出Seed-Thinking-v1.5:推理AI競賽中的新力量

OpenAI 推出 “經驗證的組織” 流程，強化 AI 模型使用安全

上海AI實驗室開源InternVL3系列多模態大型語言模型

崑崙萬維開源Skywork-OR1系列模型 數學代碼能力出色

相關推薦

崑崙萬維天工開放平臺面向OpenAl API用戶推出“一鍵搬家計劃”

​馬斯克的 xAI被質疑使用“非法”發電機爲 Colossus 超算供電

字節跳動推出Seed-Thinking-v1.5:推理AI競賽中的新力量

OpenAI 推出 “經驗證的組織” 流程，強化 AI 模型使用安全

上海AI實驗室開源InternVL3系列多模態大型語言模型

崑崙萬維開源Skywork-OR1系列模型數學代碼能力出色

馬斯克的 xAI被質疑使用“非法”發電機爲 Colossus 超算供電