相關推薦
用一個密鑰,打開全球AI的能力邊界 ——我們正在打造面向未來的“全球AI聚合網關”
過去兩年AI技術快速發展,ChatGPT和多模態模型推動變革,企業和開發者積極應用AI提升生產力。但實際落地面臨四大挑戰:模型接口標準不統一、成本管理複雜、數據安全合規要求高、混合模型調用缺乏統一管理。這些問題制約了AI的規模化應用。
Oct 23, 2025
408.6k
字節跳動推出 Sa2VA:結合 LLaVA 與 SAM-2 實現多模態智能分割
字節跳動聯合高校推出Sa2VA模型,結合LLaVA視覺語言模型與SAM-2分割模型,能理解視頻內容並精確追蹤分割角色和物體。LLaVA擅長宏觀敘事,SAM-2精於細節分割,互補提升視頻分析能力。
Oct 21, 2025
144.3k
全面開源的 LLaVA-OneVision-1.5,超越 Qwen2.5-VL 的多模態模型登場
開源社區推出LLaVA-OneVision-1.5多模態模型,實現技術突破。該模型歷經兩年發展,從基礎圖文對齊升級爲能處理圖像、視頻的綜合框架,核心提供開放高效的可復現訓練架構,支持用戶便捷構建高質量視覺語言模型,訓練過程分三個階段推進。
Oct 17, 2025
138.7k
蘋果即將在2025年國際計算機視覺大會亮相
蘋果公司將在2025年10月檀香山舉辦的國際計算機視覺大會(ICCV)上展示八篇論文,聚焦多模態模型和視頻生成等前沿技術,分享其在計算機視覺領域的最新研究成果。
Oct 14, 2025
74.9k
馬斯克挖角 NVIDIA 核心團隊,xAI 加速 “世界模型” 研發
馬斯克旗下xAI公司正加速開發“世界模型”,以推動通用人工智能(AGI)發展。爲此,公司從英偉達挖來兩位核心研究員Zeeshan Patel和Ethan He,他們在Omniverse平臺有重要貢獻,將爲xAI帶來技術專長。
Oct 13, 2025
130.2k
