崑崙萬維科技股份有限公司宣佈,其旗下的「天工大模型4.0」o1版(Skywork o1)正式啓動邀請測試。這一消息標誌着公司在通用人工智能領域邁出了重要一步,旨在通過技術創新實現更高層次的人工智能應用。

Skywork o1是崑崙萬維集團發佈的系列模型,具備慢思考推理能力,是國內首款擁有中文邏輯推理能力的o1模型。該模型不僅在模型輸出上內生了思考、計劃、反思等能力,而且在標準評測集上的推理能力相較於普通模型有顯著提升。此次發佈的Skywork o1包括三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview,其中Skywork o1Open是基於Llama3.18B的開源模型,Skywork o1Lite具備完整的思考能力,而Skywork o1Preview則提供了更多樣化和深入的思考過程。

微信截圖_20241127101930.png

崑崙萬維集團表示,Skywork o1Open在數學和代碼指標上均有大幅提高,將Llama-3.1-8B的性能提升至同生態位SOTA水平,並解鎖了許多輕量級模型無法解決的複雜數學任務。此外,公司還將開源兩個推理任務的Process Reward Model(PRM):Skywork o1Open-PRM-1.5B 和Skywork o1Open-PRM-7B,這些模型能夠對每個步驟進行打分,提升了推理和思考能力。

微信截圖_20241127102006.png

Skywork o1在邏輯推理任務上的性能提升得益於崑崙萬維自研的訓練方案,包括推理反思能力訓練、推理能力強化學習和推理planning。這些技術的應用使得Skywork o1在常識推理、邏輯推理、數學推理、倫理決策等問題上表現出色。

崑崙萬維強調,Skywork o1的發佈不僅是公司“All in AGI 與 AIGC”戰略的重要舉措,也是構建AI技術棧的重要一步。公司將繼續致力於實現通用人工智能,讓每個人更好地塑造和表達自我。

嚐鮮地址:www.tiangong.cn