京東推出 JoyAI-LLM-Flash 大模型，推動 AI 技術革新

京東於 2 月 14 日在 Hugging Face 平臺上正式開源了其最新的大模型 ——JoyAI-LLM-Flash。該模型總參數達到 48 億，其中激活參數爲 3 億，經過 20 萬億文本 Token 的預訓練，展現出卓越的前沿知識理解、推理能力和編程技能。

JoyAI-LLM-Flash 採用全新 FiberPO 優化框架，將纖維叢理論引入強化學習，並結合 Muon 優化器及稠密多 Token 預測技術，成功解決了傳統模型規模擴展時的不穩定問題。與非 MTP 版本相比，其吞吐量提升了 1.3 倍至 1.7 倍，極大增強了模型的訓練效率和應用潛力。

這款模型的架構爲混合專家模型（MoE），層數達到 40 層，支持 128K 的上下文長度和 129K 的詞表大小，標誌着京東在 AI 領域的重要進展。

月之暗面聯手UCLA推新模型Mixture-of-Expert，提升語言模型訓練效率

在人工智能領域，訓練大型語言模型（LLMs）已成爲推動技術進步的重要方向。然而，隨着模型規模和數據集的不斷擴大，傳統的優化方法 —— 特別是 AdamW—— 逐漸顯露出其侷限性。研究人員面臨着計算成本高、訓練不穩定等一系列挑戰，包括梯度消失或爆炸、參數矩陣更新不一致及分佈式環境下的資源需求高等問題。因此，迫切需要更高效、更穩定的優化技術來應對這些複雜性。爲了解決這些挑戰，Moonshot AI （月之暗面）與加州大學洛杉磯分校(UCLA)聯合開發了 Moonlight，一個使用 Muon 優

谷歌DeepMind推Lyria 3：AI音樂生成新標杆非商業用途免費開放

谷歌DeepMind正式發佈了其最新一代AI音樂生成模型Lyria 3，該模型現已作爲測試版（Beta）集成至Gemini應用，並向全球年滿 18 歲的用戶免費開放。 Lyria3 最爲引人注目的特點在於其全場景創作能力。即便用戶毫無音樂基礎，也能通過三種方式輕鬆生成音樂。用戶只需輸入自然語言提示，如“一首歡快的雷鬼音樂，適合海灘派對”或“一首關於太空探索的史詩電子樂”，模型便能迅速生成一首包含人聲、歌詞和樂器伴奏的完整 30 秒歌曲，且自動匹配描述的風格、情緒和節奏。

消息稱蘋果正研發三款AI可穿戴設備：包括AI智能眼鏡等

蘋果公司正全力推進三款AI可穿戴設備的研發進程，涵蓋AI智能眼鏡、AI別針/吊墜（AI pin or pendant）以及帶攝像頭的AI AirPods。這些設備均設計爲與iPhone無縫連接，並能夠與正在開發中的更智能版Siri進行深度交互。據悉，這三款新品均將集成攝像頭功能，使AI能夠“洞察”佩戴者周圍環境，並就相關問題提供即時解答。

豆包登頂蘋果App Store免費榜此前與春晚聯動互動總數達19億

字節跳動旗下的AI助手豆包App成功反超阿里系的千問與螞蟻阿福，躍居排行榜首位。這一成績的取得，與豆包近期在央視春晚期間的高曝光度及用戶互動活動密不可分。 2月16日，豆包宣佈與央視總檯春晚展開聯動，據其披露，除夕當天豆包AI的互動總數高達19億次，展現出強大的用戶吸引力。

英偉達Meta合作上熱搜後者將部署數百萬顆Blackwell GPU

近日，NVIDIA正式宣佈與Meta建立一項爲期多年、跨世代的戰略合作伙伴關係。根據雙方達成的協議內容，Meta計劃在其超大規模的AI數據中心內部署數百萬顆NVIDIA的Blackwell GPU，以及專爲智能體AI推理量身打造的下一代Rubin架構GPU，以強化其AI算力基礎。

京東推出 JoyAI-LLM-Flash 大模型，推動 AI 技術革新

相關推薦

月之暗面聯手UCLA推新模型Mixture-of-Expert，提升語言模型訓練效率

谷歌DeepMind推Lyria 3：AI音樂生成新標杆 非商業用途免費開放

消息稱蘋果正研發三款AI可穿戴設備：包括AI智能眼鏡等

豆包登頂蘋果App Store免費榜 此前與春晚聯動互動總數達19億

英偉達Meta合作上熱搜 後者將部署數百萬顆Blackwell GPU

谷歌DeepMind推Lyria 3：AI音樂生成新標杆非商業用途免費開放

豆包登頂蘋果App Store免費榜此前與春晚聯動互動總數達19億

英偉達Meta合作上熱搜後者將部署數百萬顆Blackwell GPU