相關推薦
Jan團隊發佈Jan-v2-VL-Max!30B多模態模型專攻長週期Agent任務,長序列執行穩超Gemini 2.5 Pro
Jan團隊發佈300億參數多模態大模型Jan-v2-VL-Max,專爲長週期、高穩定性自動化任務設計,性能超越谷歌Gemini2.5Pro與DeepSeek R1。該模型重點解決多步任務中的“誤差累積”和“失焦”問題,爲開源智能體生態提供強大支持。
Dec 24, 2025
165.7k
長跑型 AI 登場:Jan 團隊發佈 Jan-v2-VL,深度優化多步任務執行力
Jan團隊推出30B參數多模態模型Jan-v2-VL-Max,專注解決AI在複雜自動化任務中易中斷的痛點。該模型基於Qwen3-VL-30B-A3B-Thinking,引入LoRA-based RLVR技術,旨在提升多步操作的穩定性,實現更可靠的長週期任務執行。
Dec 24, 2025
173.2k
前字節視覺大模型 AI 平臺負責人潘欣加盟美團 出任多模態AI創新業務負責人
美團任命前字節跳動AI負責人潘欣爲多模態AI業務負責人,直接向技術委員會彙報,強化其“外賣+AI”戰略。潘欣曾主導Google Brain的TensorFlow動態圖模塊,並在百度、騰訊、字節跳動任職,具備中美頂尖研發經驗。
Dec 11, 2025
162.9k
智譜開源 GLM-4.6V 系列:106B 原生支持 Function Call,輕量版 9B 免費商用
智譜發佈開源多模態大模型GLM-4.6V系列,包括基礎版(106B參數)和輕量版(9B參數)。新模型將上下文窗口擴展至128k tokens,視覺理解精度達到同參數規模最優水平,並首次原生集成Function Call能力,實現從視覺感知到可執行行動的完整鏈路。API價格大幅下調,基礎版輸入1元/百萬tokens,輸出3元/百萬tokens;輕量版完全免費,已集成至GLM Coding Plan。
Dec 9, 2025
209.8k
智源研究院推出全球最強多模態世界模型Emu3.5 一鍵預測真實世界“下一秒”!
北京智源人工智能研究院發佈新一代多模態大模型Emu3.5,實現“世界級統一建模”,突破傳統AI在物理理解和因果推理上的短板,讓AI從單純生成圖像、文本進化到真正理解物理世界。
Dec 4, 2025
199.4k
