相關推薦
1美元跑200個瀏覽器任務!開源瀏覽器操控神器BU-30B-A3B-Preview橫空出世
近日,開源項目BrowserUse發佈自研大語言模型BU-30B-A3B-Preview,被譽爲網頁代理領域新標杆。該模型採用混合專家(MoE)架構,總參數達300億,但推理時僅激活部分參數,兼顧強大性能與輕量化運行,顯著降低了AI瀏覽器操作的成本與門檻。
Dec 26, 2025
134.0k
日本數據科學家推出“零錯誤”編程語言 Sui,聲稱讓大模型寫代碼準確率達100%
日本數據科學家本田崇人推出全新編程語言Sui,其設計理念源自日本美學“粋”,追求極致精煉。該語言通過消除語法錯誤、用數字代替變量名、確保每行代碼獨立運行,旨在解決大模型生成代碼時常見的語法、命名混亂及上下文依賴問題,提升代碼生成質量。
Dec 16, 2025
177.1k
螞蟻開源 LLaDA2.0,業內首個100B 參數規模的擴散語言模型
螞蟻技術研究院發佈LLaDA2.0系列,包含16B和100B版本,其中100B版爲業內首個百億參數離散擴散大語言模型。該模型突破擴散模型規模化瓶頸,顯著提升生成質量與推理速度,爲領域發展提供新方向。
Dec 12, 2025
314.8k
阿里通義推出新型強化學習方法 SAPO,讓大語言模型更穩更強
阿里通義Qwen團隊推出Soft Adaptive Policy Optimization(SAPO),旨在解決大語言模型強化學習中策略優化不穩定的問題。相比傳統硬剪切方法,SAPO通過自適應調整更新幅度,避免過於嚴格限制,提升訓練穩定性和效率。
Dec 10, 2025
173.4k
普惠算力新解法:英博雲如何通過 K8S 原生架構降低 AI 研發門檻
大模型時代,算力需求激增,但中小企業與科研機構面臨GPU獲取難題:本地部署成本高、維護難;傳統雲服務配置複雜、調度不靈活。需探索更經濟、靈活的算力解決方案。
Dec 3, 2025
137.7k
