魔搭社區開源了一種名爲 OneLLM 的多模態對齊統一框架。該框架利用通用編碼器和統一的投影模塊與 LLM 對齊多模態輸入。它支持圖像、音頻、視頻等多種模態數據的理解,並在視頻 - 文本、音頻 - 視頻 - 文本等任務中表現出較強的零樣本能力。OneLLM 的開源代碼已經發布在 GitHub 上,可以在該平臺上獲得相關模型權重和模型創空間。
相關推薦
工作流邁向工程化!國內開源 AI 智能體 Runtime 框架 MateClaw 發佈 v1.5.0 重磅更新
開源AI智能體框架MateClaw發佈v1.5.0版本,重點優化團隊運行底層基礎設施,包括目標可驗收、知識庫一致性維護和多用戶記憶隔離三大功能,解決了傳統智能體僅依賴模糊“完成度分數”評估任務的問題,提升管理透明度。
Jun 8, 2026
201.4k
幾分鐘拼出視頻AI應用!開源框架VideoPipe讓CV落地如搭積木般簡單
VideoPipe是一款開源視頻分析框架,專注於計算機視覺AI算法的快速集成與落地。其核心創新在於採用可組合的管線設計,將複雜任務模塊化,幫助開發者簡化底層編碼,聚焦業務邏輯,提升開發效率。
Dec 29, 2025
223.9k
阿里重磅開源AgentScope 1.0:智能體開發全鏈路革新
阿里巴巴雲智能集團發佈AgentScope1.0智能體開發框架,具備實時介入控制、智能上下文管理和高效工具調用能力。該框架採用模塊化設計和三層技術架構,提供從開發、部署到監控的全流程支持,顯著提升智能體應用的開發效率與生產穩定性。
Sep 3, 2025
320.4k
Youtu-Agent 智能體框架正式開源,引領 AI 發展新潮流
騰訊優圖實驗室開源Youtu-Agent框架,專爲構建、運行和評估自主AI智能體設計。該框架模塊化、高性能,支持開源模型集成,在數據分析、文件處理等任務中表現優異,有望重塑AI智能體開發格局。
Sep 2, 2025
243.5k
通義實驗室推出新一代智能體開發框架AgentScope 1.0
通義實驗室推出新一代智能體開發框架AgentScope1.0,以開發者爲中心,專注多智能體開發,解決構建、運行和管理難題。該框架提供覆蓋開發、部署和監控的全生命週期解決方案,採用三層技術架構,包括核心框架和Runtime,旨在簡化並提升智能體應用開發的安全性和效率。
Sep 2, 2025
198.6k
