書生·浦語2.5開源超輕量1.8B、高性能20B多種參數版本

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 19, 2025

上海人工智能實驗室在2024年7月4日的WAIC科學前沿主論壇上推出了書生·浦語系列模型的新版本InternLM2.5。這個版本在複雜場景下的推理能力得到了全面增強，支持1M超長上下文，並能自主進行互聯網搜索及整合上百個網頁的信息。

InternLM2.5發佈了三種參數版本的模型，分別是1.8B、7B和20B，以適應不同應用場景和開發者需求。1.8B版本是超輕量級模型，20B版本則提供更強的綜合性能，支持更復雜的實用場景。所有這些模型都已開源，可以在書生·浦語系列大模型主頁、ModelScope主頁以及Hugging Face主頁上找到。

微信截圖_20240807133852.png

InternLM2.5在多個數據合成技術上進行了迭代，顯著提升了模型的推理能力，特別是在數學評測集MATH上的準確率達到了64.7%。此外，模型通過在預訓練階段進行高效訓練，提升了上下文長度的處理能力。

InternLM2.5系列模型還實現了與下游推理和微調框架的無縫對接，包括上海人工智能實驗室自主研發的XTuner微調框架和LMDeploy推理框架，以及其他社區中有廣泛用戶基礎的框架如vLLM、Ollama和llama.cpp。魔搭社區推出的SWIFT工具也支持InternLM2.5系列模型的推理、微調和部署。

這些模型的應用體驗包括多步複雜推理、多輪對話意圖的精準理解、靈活的格式控制操作以及遵循複雜指令的能力。提供了詳細的安裝和使用指南，方便開發者快速上手。

書生·浦語系列大模型主頁:

https://internlm.intern-ai.org.cn

ModelScope 主頁:

https://www.modelscope.cn/organization/Shanghai_AI_Laboratory?tab=model

Hugging Face 主頁:

https://huggingface.co/internlm

InternLM2.5開源鏈接:

https://github.com/InternLM/InternLM

報道稱三星8層HBM3E芯片通過英偉達測試，未來供應在望

三星電子的第五代高帶寬內存（HBM）芯片HBM3E，已通過英偉達的測試，獲得在人工智能處理器中的使用資格。儘管雙方尚未簽署正式協議，預計很快將達成供應協議，預計供應將在2024年第四季度開始。此成就對三星而言是與當地競爭對手SK海力士競爭中的關鍵突破。然而，三星的12層HBM3E芯片在測試中未能通過，爲此三星對設計進行了調整以解決熱量和功耗問題。HBM作爲DRAM的一種，通過垂直堆疊方式節省空間和降低功耗，對GPU處理複雜數據應用至關重要。隨着生成式人工智能技術的興起，市場對高性能GPU需求激增，預計HBM3E芯片將在今年成爲市場主流，尤其在下半年。三星預計到2024年第四季度，HBM3E芯片將佔其HBM芯片銷售的60%。目前，全球主要的HBM製造商僅包括SK海力士、美光和三星。此外，三星在2023年上半年的總DRAM芯片收入約爲22.5萬億韓元，其中約10%可能來自HBM的銷售。這一消息引起了市場的廣泛關注和投資者的期待。

ChatGPT Mac 版應用大更新，提供了並排窗口方便多任務處理

OpenAI 更新了其 Mac 版 ChatGPT 應用，引入並排窗口功能，允許用戶在任何應用中通過按 Option + Space 組合鍵與 ChatGPT 交互時，同時保持應用界面與迷你 ChatGPT 窗口並排顯示，從而實現更便捷的多任務處理。此更新減少了窗口切換的麻煩，特別是在小屏幕上使用時更爲便利。此外，OpenAI 正在研究一種針對生成內容的文本水印方法，旨在追蹤和防止內容篡改，但因擔心可能對非英語母語用戶產生負面影響，該方法目前暫未實施。

戴爾新一輪大規模裁員以推動人工智能轉型，裁員估計達12500人

戴爾公司近期進行第二輪大規模裁員，這是其15個月內第二次採取此類行動。裁員重點在於調整銷售團隊結構，強化人工智能產品銷售，並優化數據中心銷售策略。據透露，本週約有12500名員工受到影響，主要爲銷售和營銷團隊成員。自15個月前開始，戴爾已累計裁員超過2萬人，上一財年已裁員13000人，其中近一半發生在去年2月。裁員調整旨在精簡管理層，重新分配投資優先級，以更好地適應市場變化和客戶需求。

AI設計加持"義烏製造"：AI設計穿戴甲火到巴黎奧運

一款AI設計的穿戴甲在巴黎走紅，爲“義烏製造”注入新活力。義烏一生產商“土哥”與36氪團隊合作，利用阿里雲大模型通義千問開發出AI設計產品LumiNail，只需關鍵詞輸入，AI就能生成原創美甲設計，提高效率並激發創意。設計涵蓋埃菲爾鐵塔、莫奈睡蓮、梵高星空向日葵等元素，美觀且具文化內涵。產品在巴黎實地調研中大受歡迎，顯示AI技術在傳統制造業中的應用潛力。義烏已有大量商家嘗試AI輔助生產，此次成功展示了傳統行業通過創新和技術融合在全球市場中的競爭力。

Meta推“自學評估器”: 無需人工註釋NLP模型評估，優於 GPT-4 等常用的LLM

自然語言處理領域中，大型語言模型在複雜任務上表現出色，但模型評估高度依賴昂貴且耗時的人類註釋數據，且隨着模型進步，原有數據的效用下降，需持續收集新數據以維持評估的規模化與可持續性。Meta FAIR 研究團隊針對這一問題提出“Self-Taught Evaluator”（自學評估器），這一創新方法通過合成數據進行訓練，無需依賴人類註釋。通過生成對比的合成偏好對，模型自我評估與迭代改進，顯著提高了模型在 RewardBench 基準上的準確率，從75.4提升至88.7，甚至超越了使用人類註釋訓練的模型。經過多次迭代，最終模型在單次推理中達到88.3的準確率，多數投票下達到88.7，展現出強大的穩定性和可靠性。此方法爲 NLP 模型評估提供了可擴展且高效的解決方案，通過利用合成數據和迭代自我改進，有效應對了依賴人類註釋的挑戰，推動了語言模型的發展。