相關推薦
阿里通義千問Qwen3-Max 在官網上線深度思考功能
阿里通義千問推出Qwen3-Max模型,新增“深度思考”模式,通過強化推理鏈分析和多步驟問題拆解,顯著提升複雜任務處理效率。該模型參數量超1萬億,預訓練數據達36T tokens,是目前規模最大、能力最強的版本,在代碼和智能體能力方面均有明顯進步。
Nov 3, 2025
143.3k
蘋果推出全新 FS-DFM 模型,AI 長文本寫作效率提升128倍!
蘋果與俄亥俄州立大學聯合推出FS-DFM模型,僅需8輪迭代即可生成媲美傳統模型上千輪迭代的長文本,寫入速度提升高達128倍,突破長文本生成效率瓶頸。該模型採用離散流匹配技術,區別於ChatGPT等逐字生成的自迴歸模型。
Oct 14, 2025
116.0k
螞蟻發佈萬億參數語言模型 Ling-1T,推理速度與能力引領行業新標杆
螞蟻集團發佈首款萬億參數開源模型Ling-1T,在推理、代碼生成、數學計算等領域表現卓越,樹立國產AI新標杆。該模型以超強推理速度與能力實現技術突破,測試中超越多款知名開源模型。
Oct 9, 2025
139.6k
谷歌DeepMind 發佈 VaultGemma 具備差分隱私能力
谷歌 DeepMind 最近推出了一款名爲 VaultGemma 的新型語言模型,這一創新的技術專注於用戶隱私的保護。VaultGemma 不僅是開源的,而且是目前規模最大的具備差分隱私能力的語言模型,參數數量達到了驚人的10億。這項技術的發佈,標誌着人工智能領域在保護用戶數據隱私方面的重大進步。傳統的大語言模型在訓練過程中可能會不小心記住一些敏感信息,比如姓名、地址和機密文檔等。爲了應對這一挑戰,VaultGemma 引入了差分隱私技術,通過在訓練過程中添加可控的隨機噪聲,確保模型的輸出無
Sep 16, 2025
131.1k
字節Seed推出全新 AgentGym-RL 框架:提升大規模語言模型的決策能力
研究聚焦於開發大規模語言模型代理,需強化學習框架支持其自主學習。當前缺乏從零訓練的有效方法,不依賴監督微調,需探索多樣化真實環境下的訓練方案。
Sep 11, 2025
153.6k
