相關推薦
字節開源全新代碼大模型評估基準“FullStack Bench”
12月5日,字節豆包大模型團隊推出了最新的代碼大模型評估基準——FullStack Bench,涵蓋了超11類真實場景,支持16種編程語言,幷包含3374個問題。這一基準相比之前的評估標準,在更廣泛的編程領域中能更準確地評估大模型的代碼開發能力,推動了模型在現實世界編程任務中的優化。目前的主流代碼評估基準,如HumanEval和MBPP,通常集中在基礎和高級編程問題,而DS-1000則專注於數據分析和機器學習任務,且僅支持Python。xCodeEval則側重於高級編程和數學領域,存在較大的應用場景和語言覆蓋限
DeepSeek 發佈開源代碼大模型 DeepSeek Coder
["DeepSeek(深度求索)發佈了開源代碼大模型 DeepSeek Coder","DeepSeek Coder 是一個智能代碼助手,可以生成各種代碼","DeepSeek Coder 已經在 Hugging Face 和 GitHub 上開源","DeepSeek Coder 在國際權威數據集的測試中表現出色","DeepSeek 致力於探索 AGI 的本質,將推出更多研究成果"]
eBay攜手ChatGPT開啓智能電商新時代,購物體驗將全面升級!
電商巨頭eBay宣佈與ChatGPT達成戰略合作,共同打造“統一智能體電商平臺”。通過整合eBay自有AI購物助手與ChatGPT等第三方智能體,旨在提升消費者購物體驗的個性化和便捷性。eBay CEO強調,將利用平臺30年積累的海量數據,爲用戶提供更精準的商品推薦服務。
微軟調整 Microsoft365Copilot,取消默認 AI 內容免責聲明
微軟關閉Microsoft365Copilot默認免責聲明,以提升用戶體驗。企業用戶反饋該提示分散注意力,現聊天窗口底部聲明將自動隱藏,不再幹擾操作。
阿里 AI 編程工具 Qoder 將全面支持 JetBrains 系列 IDE
阿里巴巴AI編程工具Qoder本週起原生支持JetBrains系列IDE,包括IntelliJ、PyCharm等。新增Agent Mode自動選擇AI模型提升編碼效率,Inline Chat提供實時AI對話功能,強化開發輔助體驗。
