正文

馬毅團隊發現：微調多模態大模型會導致災難性遺忘

發布於AI新閒資訊

時間 :Sep 28, 2023

閱讀 :1分鐘

隨着 GPT-4 的發佈，多模態大模型（MLLM）成爲熱點。馬毅團隊提出了 EMT 框架，評估微調後的 MLLM 的災難性遺忘。實驗發現，微調 MLLM 在提升微調數據集性能的同時，也導致其他數據集性能下降。微調過程中，MLLM 會產生與微調數據集相關的幻覺文本，忽略原始問題。研究爲後續工作提供了框架和基準，模型設計和訓練技巧仍需進一步優化。馬毅團隊首次系統評估了 MLLM 中的災難性遺忘問題，平衡不同能力之間的權衡。

谷歌發佈Nested Learning新範式，解決AI“災難性遺忘”難題

谷歌在NeurIPS2025發佈"嵌套學習"新範式，突破AI"災難性遺忘"難題。該技術受人類神經可塑性啓發，使模型持續學習新任務時幾乎不丟失舊知識，遺忘率接近零。這標誌着AI從"一次性專家"向"終身學習者"轉變的關鍵進展。

Nov 10, 2025

162.1k

巨量引擎亮出AI治理“利劍”：自研多模態大模型10分鐘審90%廣告，單季攔截84萬違規素材

巨量引擎推出自研AI廣告治理大模型，通過"全鏈路治理"框架和"以AI治AI"策略應對AI生成內容引發的虛假宣傳等風險。該多模態模型顯著提升審覈效率，90%廣告素材可在10分鐘內完成智能審覈，大幅超越人工處理速度。

Oct 27, 2025

131.1k

突破瓶頸！上交大與上海AI Lab攜手提升多模態大模型反思能力

上海交大與上海AI實驗室推出MM-HELIX項目，旨在解決多模態大模型在複雜推理中缺乏反思能力的問題。該項目通過模擬人類長鏈反思性推理，提升AI處理需多次嘗試挑戰的能力，推動模型從“耿直”轉向靈活思考。

Oct 21, 2025

113.2k

抖音與LV-NUS聯合推出SAIL-VL2模型：小巧身材也能大顯神威！

抖音SAIL團隊與LV-NUS Lab聯合推出SAIL-VL2多模態大模型，以2B和8B較小參數規模，在106個數據集上實現性能突破。該模型在MMMU、MathVista等複雜推理任務中超越同類模型，甚至媲美大型閉源模型，顯著拓展了小模型的應用潛力。

Oct 14, 2025

169.5k

生數科技完成新一輪數億元規模A輪融資

2025年9月19日，生數科技宣佈完成新一輪數億元人民幣規模的A輪融資，此次融資由博華資本領投，百度戰投、北京市人工智能產業投資基金、啓明創投、達泰資本、BV百度風投等老股東持續跟投，同時建發新興投資等產業合作方也加碼跟投。生數科技自2023年成立以來，憑藉其強大的核心團隊，該團隊由來自清華大學、北京大學、帝國理工學院、卡耐基梅隆大學等全球頂尖高校的技術人才以及產業界的產品研發和產業服務人才組成，展現出深厚的產業實踐經驗和全球化技術落地能力。

Sep 19, 2025

129.2k

智啟未來，您的人工智能解決方案智庫