據券商中國消息,針對“DeepSeek新一代AI模型R2提前發佈”的傳聞,幻方量化相關人士作出迴應,表示一切以官方消息爲準。
據悉,幻方量化於2023年7月17日成立深度求索AI公司,並在今年1月成功發佈了DeepSeek-R1模型。

而近日,路透社援引三位知情人士的消息稱,DeepSeek正在加速推進R2模型的發佈計劃,原定於5月發佈的計劃現正努力提前。據知情人士透露,新一代模型DeepSeek-R2在代碼生成能力上有望實現提升,並具備用英語以外的語言進行推理的功能。

據券商中國消息,針對“DeepSeek新一代AI模型R2提前發佈”的傳聞,幻方量化相關人士作出迴應,表示一切以官方消息爲準。
據悉,幻方量化於2023年7月17日成立深度求索AI公司,並在今年1月成功發佈了DeepSeek-R1模型。

而近日,路透社援引三位知情人士的消息稱,DeepSeek正在加速推進R2模型的發佈計劃,原定於5月發佈的計劃現正努力提前。據知情人士透露,新一代模型DeepSeek-R2在代碼生成能力上有望實現提升,並具備用英語以外的語言進行推理的功能。
中國AI實驗室DeepSeek開發的聊天機器人應用本週登頂蘋果和谷歌應用商店下載榜首,引發華爾街和科技界對美國AI領先地位及芯片需求可持續性的質疑。該公司由量化基金幻方量化支持,採用高效計算技術訓練AI模型,其創始人梁文鋒於2015年創立該基金並運用AI輔助交易決策。
近日,《Nature》雜誌的最新一期封面論文引起了廣泛關注,研究主題是 DeepSeek-R1。這項研究由梁文鋒教授團隊主導,內容圍繞如何通過強化學習來提升大型語言模型(LLM)的推理能力。早在今年1月,該研究已在 arXiv 上發佈,受到學術界的高度評價。在封面介紹中,《Nature》指出,如果大型模型能夠規劃解決問題的步驟,往往會得到更好的解決方案。這種推理能力與人類處理複雜問題的方式相似,但在人工智能領域實現這一點面臨着巨大的挑戰。研究團隊展示瞭如何在極少人工干預的情況
微軟開源rStar2-Agent AI推理模型,僅140億參數卻在AIME24數學測試中取得80.6%準確率,超越6710億參數的DeepSeek-R1。這一突破重新定義模型規模與性能關係,展現小參數模型的高效潛力。
美團M17團隊推出Meeseeks評測基準,旨在評估大型語言模型如OpenAI、Claude3.5Sonnet等的指令遵循能力,解決模型輸出內容雖好但未滿足具體格式或內容要求的問題。
近日有傳言稱DeepSeek-R2將於8月發佈,但知情人士向騰訊科技確認該消息不實,本月並無發佈計劃。關於R2模型的討論自年初就已開始流傳。