相關推薦
蘋果發佈多模態新模型 Manzano:打破“看圖”與“繪圖”的界限
蘋果推出多模態模型Manzano,通過創新的“雙修”架構,解決了AI領域長期存在的視覺理解與圖像生成難以兼顧的難題。
Jan 15, 2026
159.3k
月之暗面再推多模態新模型,Kimi K2 升級版擬於第一季度亮相
月之暗面計劃於2026年第一季度推出多模態模型K2.1/K2.5,該模型基於其萬億參數開源模型Kimi K2升級,旨在提升多模態處理與智能體能力。Kimi K2自2025年7月發佈後,憑藉混合專家架構在代碼生成等領域表現出色。
Jan 4, 2026
230.4k
智譜多模態開源周圓滿落幕:四項視頻生成核心技術全面開放
智譜團隊開源四項視頻生成核心技術,包括GLM-4.6V視覺理解、AutoGLM設備控制、GLM-ASR語音識別和GLM-TTS語音合成模型,展示其在多模態領域的最新進展,爲視頻生成技術發展奠定基礎。
Dec 12, 2025
178.1k
DeepMind 首席執行官預測 2026 年三大 AI 發展趨勢
谷歌DeepMind CEO哈薩比斯在Axios AI+峯會上預測,2026年將是多模態AI、互動視頻世界和可靠AI代理快速發展的關鍵一年。他特別提到,其最新模型Gemini在多模態能力上已取得顯著進展,不僅能描述情節,還能深入理解場景深層含義。
Dec 8, 2025
285.6k
法國 AI 公司 Mistral 發佈新模型,力求與 OpenAI 和谷歌保持競爭
法國AI公司Mistral發佈新模型,旨在追趕谷歌、OpenAI等全球領先實驗室。此次推出包括號稱“最佳開放權重多模態多語言模型”的大型模型,以及適用於機器人設備的小型模型,凸顯全球AI領域競爭加劇。
Dec 3, 2025
133.1k
