相關推薦
艾倫人工智能研究所推出 Molmo 2 開源視頻語言模型
艾倫人工智能研究所發佈開源視頻語言模型Molmo2系列,包括基於阿里巴巴Qwen3的4B和8B版本,以及基於Ai2Olmo的完全開源7B版本,並公開訓練數據,彰顯其開源承諾。
Dec 17, 2025
116.0k
Meta開源神話崩塌:閉源新模型竟靠阿里Qwen訓練,小扎“煲湯求才”換來戰略大轉向
Meta計劃於2026年春季發佈代號“Avocado”的AI模型,可能轉向閉源,並使用了阿里巴巴開源模型Qwen進行訓練。消息引發市場關注,阿里巴巴股價上漲。
Dec 12, 2025
176.2k
智譜開源 GLM-4.6V 系列:106B 原生支持 Function Call,輕量版 9B 免費商用
智譜發佈開源多模態大模型GLM-4.6V系列,包括基礎版(106B參數)和輕量版(9B參數)。新模型將上下文窗口擴展至128k tokens,視覺理解精度達到同參數規模最優水平,並首次原生集成Function Call能力,實現從視覺感知到可執行行動的完整鏈路。API價格大幅下調,基礎版輸入1元/百萬tokens,輸出3元/百萬tokens;輕量版完全免費,已集成至GLM Coding Plan。
Dec 9, 2025
189.3k
微軟開源實時語音模型VibeVoice-Realtime-0.5B,300ms實時開聲,90分鐘長音頻都不喘!
微軟開源實時語音模型VibeVoice-Realtime-0.5B,具備極低延遲和接近真人的語音表現。該模型從文本輸入到發聲平均僅需300毫秒,遠低於傳統TTS模型的1-3秒,實現近乎零延遲的實時語音合成。
Dec 5, 2025
352.4k
vLLM-Omni 發佈:可以處理文本、圖像、音頻和視頻
vLLM團隊推出vLLM-Omni推理框架,支持文本、圖像、音頻和視頻等多模態輸入輸出,旨在簡化多模態推理過程,爲新一代全模態模型提供強大支持。
Dec 2, 2025
177.0k
