上海人工智能實驗室宣佈其書生大模型迎來了重要版本升級,推出了書生・浦語3.0(InternLM3)。據實驗室介紹,新的版本通過精煉的數據框架,顯著提升了數據使用效率,從而實現了思維密度的提升。
此次升級的 InternLM3-8B-Instruct 模型僅使用4T 的數據進行訓練,官方表示其綜合性能超過了同等規模的開源模型,且訓練成本節約了超過75%。值得注意的是,這一版本首次在通用模型中實現了常規對話與深度思考能力的融合,能夠更好地應對多樣化的真實使用場景。
在模型的評測方面,研究團隊基於司南 OpenCompass 開源評測框架,採用了一種統一可復現的方法進行評測。評測內容涉及 CMMLU、GPQA 等十多個權威評測集,涵蓋推理、數學、編程、指令跟隨、長文本生成、對話及綜合表現等多個維度。評測結果顯示,書生・浦語3.0在大多數評測集中的得分領先,綜合性能與 GPT-4o-mini 非常接近。
上海 AI 實驗室還表示,這一新版本的模型成爲了開源社區中首個支持瀏覽器使用的通用對話模型,能夠支持20步以上的網頁跳轉,從而實現深度信息的挖掘。
體驗頁面:https://internlm-chat.intern-ai.org.cn。
劃重點:
🌟 書生・浦語3.0模型通過4T 數據訓練,綜合性能超過同等規模的開源模型,節約超75% 訓練成本。
📊 模型在多個權威評測集上得分領先,思維與對話能力的融合大幅提升。
🌐 新模型支持瀏覽器使用,可進行深度信息挖掘,成爲開源社區的亮點之一。