Hugging Face發佈SmolLM2：小型語言模型挑戰行業巨頭

Hugging Face今天發佈了SmolLM2，一組新的緊湊型語言模型，實現了令人印象深刻的性能，同時所需的計算資源比大型模型少得多。新模型採用Apache2.0許可發佈，有三種大小——135M、360M和1.7B參數——適合部署在智能手機和其他處理能力和內存有限的邊緣設備上。

SmolLM2-1B模型在幾個關鍵基準測試中優於Meta的Llama1B模型，尤其是在科學推理和常識任務中表現出色。該模型在大多數認知基準上的表現都優於大型競爭模型，使用了包括FineWeb-Edu和專門的數學和編碼數據集在內的多樣化數據集組合。

SmolLM2的發佈正值人工智能行業努力應對運行大型語言模型（LLM）的計算需求的關鍵時刻。雖然OpenAI和Anthropic等公司不斷突破模型規模的界限，但人們越來越認識到需要能夠在設備本地運行的高效、輕量級人工智能。

SmolLM2提供了一種不同的方法，將強大的AI功能直接帶入個人設備，指向未來更多用戶和公司可以使用先進的AI工具，而不僅僅是擁有龐大數據中心的科技巨頭。這些模型支持一系列應用，包括文本重寫、摘要和函數調用，適合部署在隱私、延遲或連接限制使基於雲的AI解決方案不切實際的場景中。

雖然這些較小的模型仍然存在侷限性，但它們代表了更高效的人工智能模型的廣泛趨勢的一部分。SmolLM2的發佈表明，人工智能的未來可能不僅僅屬於越來越大的模型，而是屬於能夠以更少的資源提供強大性能的更高效的架構。

Moonshot AI發佈 Kimi Linear:線性注意力架構快6倍，開源 KDA 內核同步上線

國產團隊Moonshot AI發佈Kimi Linear架構技術報告，提出可替代完全注意力機制的混合線性架構。該架構在速度、內存效率和長上下文處理三方面實現突破，顯著降低KV緩存使用，兼具高效與性能優勢，被譽爲智能體時代注意力機制新起點。

全球首個真實物理環境多任務基準 RoboChallenge 發佈

RoboChallenge基準測試平臺正式發佈，由Dexmal原力靈機與Hugging Face聯合推出。作爲首個大規模、多任務、真實物理環境下的機器人操作評估標準，它解決了現有測試在真實性能驗證、標準化條件和公開可訪問性方面的難題，推動機器人視覺語言動作能力發展。

斯坦福分析顯示：中國在開放權重 AI 開發中奪得全球領先地位