相關推薦
智譜多模態開源周圓滿落幕:四項視頻生成核心技術全面開放
智譜團隊開源四項視頻生成核心技術,包括GLM-4.6V視覺理解、AutoGLM設備控制、GLM-ASR語音識別和GLM-TTS語音合成模型,展示其在多模態領域的最新進展,爲視頻生成技術發展奠定基礎。
Dec 12, 2025
177.9k
DeepMind 首席執行官預測 2026 年三大 AI 發展趨勢
谷歌DeepMind CEO哈薩比斯在Axios AI+峯會上預測,2026年將是多模態AI、互動視頻世界和可靠AI代理快速發展的關鍵一年。他特別提到,其最新模型Gemini在多模態能力上已取得顯著進展,不僅能描述情節,還能深入理解場景深層含義。
Dec 8, 2025
220.1k
法國 AI 公司 Mistral 發佈新模型,力求與 OpenAI 和谷歌保持競爭
法國AI公司Mistral發佈新模型,旨在追趕谷歌、OpenAI等全球領先實驗室。此次推出包括號稱“最佳開放權重多模態多語言模型”的大型模型,以及適用於機器人設備的小型模型,凸顯全球AI領域競爭加劇。
Dec 3, 2025
131.1k
商湯NEO開源:用1/10數據量媲美頂級多模態模型,終結"拼湊式"AI時代
商湯科技與南洋理工大學S-Lab聯合發佈開源多模態模型NEO,通過架構創新實現視覺語言深層統一。該模型僅需3.9億圖像文本數據(爲同類模型1/10),即可達到頂尖視覺感知性能,無需海量數據或額外視覺編碼器,在效率與通用性上取得突破。
Dec 3, 2025
130.2k
快手旗艦 Keye-VL-671B-A37B 重磅發佈,多模態推理能力實現新突破
快手發佈新一代多模態模型Keye-VL-671B-A37B並開源代碼。該模型具備“善看會想”特性,在視覺理解、視頻分析和數學推理等核心基準測試中表現優異,強化了視覺感知與跨模態對齊能力,展現快手在AI領域的技術實力。
Nov 28, 2025
155.5k
