中國團隊發佈全球最大開源多模態數據集，2B參數模型性能創新高

近日，來自多家中國科研機構的研究團隊重磅發佈了名爲Infinity-MM的超大規模多模態數據集，並基於該數據集訓練出了一個性能卓越的AI模型Aquila-VL-2B。這一突破爲多模態AI發展注入了新動力。

Infinity-MM數據集規模驚人，共包含四大類數據:1000萬條圖像描述、2440萬條通用視覺指令數據、600萬條精選高質量指令數據，以及300萬條由GPT-4等AI模型生成的數據。研究團隊採用開源AI模型RAM++進行圖像分析和信息提取，並通過獨特的六大類分類系統確保生成數據的質量和多樣性。

數據分析數據監測互聯網大數據 (2)

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

在模型架構方面，Aquila-VL-2B基於LLaVA-OneVision構建，整合了Qwen-2.5語言模型和SigLIP圖像處理技術。研究團隊採用了四階段漸進式訓練方法:從基礎的圖文關聯學習開始，逐步過渡到通用視覺任務、特定指令處理，最後融入合成數據，同時逐步提升圖像分辨率上限。

儘管僅有20億參數規模，Aquila-VL-2B在各項基準測試中表現亮眼。在多模態理解能力測試MMStar中取得54.9%的最佳成績，在數學能力測試MathVista中更是達到59%的高分，顯著超越同類系統。在通用圖像理解測試中，該模型在HallusionBench和MMBench分別獲得43%和75.2%的優異成績。

研究發現，合成數據的引入對模型性能提升貢獻顯著。實驗表明，若不使用這些額外數據，模型性能平均下降2.4%。從第三階段開始，Aquila-VL-2B的性能就顯著超越了InternVL2-2B和Qwen2VL-2B等參考模型，特別是在第四階段，隨着數據量增加，性能提升更爲明顯。

值得一提的是，研究團隊已將數據集和模型向研究社區開放，這將極大促進多模態AI技術的發展。該模型不僅在Nvidia A100GPU上完成訓練，還支持中國自研芯片，展現了強大的硬件適應性。

OpenAI 被指 “暗箱操作”，付費用戶遭遇模型降級

OpenAI近日因祕密切換模型引發爭議。付費用戶反映，在未獲通知的情況下，其GPT-4/5被自動替換爲低算力過濾模型gpt-5-chat-safety和gpt-5-a-t-mini，尤其在涉及敏感內容時響應質量驟降。此舉遭用戶質疑侵犯選擇權與知情權，凸顯平臺透明度不足的問題。

AI 逆襲：大型語言模型助力癌症新藥研發，竟然能 “發明” 療法！

近日，一項來自劍橋大學等機構的研究成果引發了廣泛關注:大型語言模型（LLMs）不僅在自然語言處理領域嶄露頭角，還能爲癌症治療帶來新的希望。研究人員利用 GPT-4模型，首次嘗試將其作爲科學假說的生成工具，在乳腺癌的藥物研發上取得了令人振奮的進展。在這項研究中，團隊的目標是找到能夠有效對抗乳腺癌的新藥物組合。他們從 FDA 批准的非抗癌藥物中篩選出可能具有協同作用的藥物，設定了三項關鍵原則:避免標準抗癌藥物，專注於能夠靶向癌細胞且不損傷健康細胞的藥物，同

AI聊天越久越"糊塗":微軟研究揭示語言模型可靠性驟降39%

微軟和Salesforce聯合研究發現，即使是最先進的AI語言模型在長時間對話中也會出現嚴重的可靠性問題。當用戶逐步表達需求時，系統性能平均下降39%，這一發現對AI助手的實際應用提出了重要警示。模擬真實交互揭示性能缺陷研究團隊創建了名爲"分片"的測試方法，模擬用戶在實際對話中逐步明確需求的過程。與傳統的一次性提供完整信息不同，這種方法將任務分解爲多個步驟，更貼近真實使用場景。測試結果令人震驚:AI模型的準確率從約90%暴跌至僅51%。從小型開源模型Llama-3.1-8B到大型商業

中國團隊發佈全球最大開源多模態數據集，2B參數模型性能創新高

相關推薦

OpenAI 心理安全負責人離職:跳槽對手 Anthropic，繼續死磕 AI 倫理難題

AI 模型用兩本書生成名家風格作品，引發版權法新討論

OpenAI 被指 “暗箱操作”，付費用戶遭遇模型降級

AI 逆襲：大型語言模型助力癌症新藥研發，竟然能 “發明” 療法！

AI聊天越久越"糊塗":微軟研究揭示語言模型可靠性驟降39%

中國團隊發佈全球最大開源多模態數據集，2B參數模型性能創新高

相關推薦

​OpenAI 心理安全負責人離職:跳槽對手 Anthropic，繼續死磕 AI 倫理難題

AI 模型用兩本書生成名家風格作品，引發版權法新討論

OpenAI 被指 “暗箱操作”，付費用戶遭遇模型降級

AI 逆襲：大型語言模型助力癌症新藥研發，竟然能 “發明” 療法！

AI聊天越久越"糊塗":微軟研究揭示語言模型可靠性驟降39%

OpenAI 心理安全負責人離職:跳槽對手 Anthropic，繼續死磕 AI 倫理難題