大語言模型迎來了“1-bit時代”,微軟和中國科學院大學提出的BitNet b1.58方法將參數轉換成三進製表示,從根本上減少了模型的內存佔用和簡化了計算過程。該方法在不同大小的模型上進行了性能比較,速度提高了並減少了內存使用,引發了網友們的熱議和討論。
相關推薦
融資2.55億美元:AI實驗室Fundamental破繭而出,用Nexus模型重塑大模型分析能力
AI初創公司Fundamental結束隱身,宣佈完成2.55億美元A輪融資,投後估值達12億美元。本輪由Oak HC/FT等多家機構領投,Perplexity和Datadog的CEO等也以個人身份參與。公司核心產品爲基礎模型Nexus,旨在與ChatGPT等主流大語言模型競爭。
Feb 6, 2026
92.7k
卡內基梅隆大學研發新 AI 系統:像“指揮家”一樣實時修復 3D 打印缺陷
卡內基梅隆大學團隊開發出基於大語言模型的3D打印實時糾錯系統。該系統模仿交響樂團,由一個“指揮家”智能體協調四個專業智能體,自動檢測並修復打印過程中的微小參數波動導致的錯誤,解決了傳統開環系統易失敗的問題。
Feb 3, 2026
153.5k
研究揭示就業寒冬早於 ChatGPT 問世,AI 衝擊波早在2022年初已顯現
研究揭示AI就業衝擊早於ChatGPT發佈。大數據分析顯示,2022年初AI相關職業需求已開始下滑,比公衆認知提前數月。
Jan 27, 2026
187.2k
一年狂飆500%!“AI教母”李飛飛再造神話,World Labs50 億美元估值劍指世界模型
李飛飛創立的World Labs正進行50億美元估值融資,計劃籌資5億美元,一年內估值翻五倍。這顯示資本市場看好其領跑的下一條AI賽道,而非當前大語言模型競爭。
Jan 26, 2026
156.4k
東軟集團攜手 Cerence AI,打造未來智能座艙新體驗
東軟集團與Cerence AI達成戰略合作,共同開發新一代智能座艙平臺,聚焦智能語音與大語言模型技術,爲全球車企提供高效、預集成的智能交互解決方案。東軟將依託其NAGIC智能座艙平臺,結合Cerence AI的前沿技術,滿足市場對智能座艙日益增長的需求。
Jan 22, 2026
159.1k
