相關推薦
百度發佈Ernie5.1:預訓練成本驟降94%,性能挺進全球Search排行榜前四
百度於2026年5月11日發佈新一代語言模型Ernie5.1,基於2.4萬億參數的Ernie5.0預訓練底座提取。通過“一次性彈性訓練框架”,實現單一訓練優化多尺寸模型,預訓練成本僅爲同類模型的6%。截至5月9日,該模型在Arena Search排行榜以1223分位列全球第四、中國第一,展現高資源利用率與性能平衡。
May 12, 2026
181.8k
阿里通義千問Qwen3-Max 在官網上線深度思考功能
阿里通義千問推出Qwen3-Max模型,新增“深度思考”模式,通過強化推理鏈分析和多步驟問題拆解,顯著提升複雜任務處理效率。該模型參數量超1萬億,預訓練數據達36T tokens,是目前規模最大、能力最強的版本,在代碼和智能體能力方面均有明顯進步。
Nov 3, 2025
226.6k
蘋果推出全新 FS-DFM 模型,AI 長文本寫作效率提升128倍!
蘋果與俄亥俄州立大學聯合推出FS-DFM模型,僅需8輪迭代即可生成媲美傳統模型上千輪迭代的長文本,寫入速度提升高達128倍,突破長文本生成效率瓶頸。該模型採用離散流匹配技術,區別於ChatGPT等逐字生成的自迴歸模型。
Oct 14, 2025
177.9k
螞蟻發佈萬億參數語言模型 Ling-1T,推理速度與能力引領行業新標杆
螞蟻集團發佈首款萬億參數開源模型Ling-1T,在推理、代碼生成、數學計算等領域表現卓越,樹立國產AI新標杆。該模型以超強推理速度與能力實現技術突破,測試中超越多款知名開源模型。
Oct 9, 2025
178.0k
谷歌DeepMind 發佈 VaultGemma 具備差分隱私能力
谷歌 DeepMind 最近推出了一款名爲 VaultGemma 的新型語言模型,這一創新的技術專注於用戶隱私的保護。VaultGemma 不僅是開源的,而且是目前規模最大的具備差分隱私能力的語言模型,參數數量達到了驚人的10億。這項技術的發佈,標誌着人工智能領域在保護用戶數據隱私方面的重大進步。傳統的大語言模型在訓練過程中可能會不小心記住一些敏感信息,比如姓名、地址和機密文檔等。爲了應對這一挑戰,VaultGemma 引入了差分隱私技術,通過在訓練過程中添加可控的隨機噪聲,確保模型的輸出無
Sep 16, 2025
172.3k
