相關推薦
英偉達發佈多模態“全能模型”,推理效率達競品 9 倍
英偉達發佈開放式多模態大模型Nemotron3Nano Omni,整合視頻、音頻、圖像和文本的深度推理能力,採用30B-A3B混合專家架構,內置視覺與音頻編碼器,旨在爲開發者提供更快速、更智能的交互響應方案。
Apr 29, 2026
223.8k
騰訊推出具身多模態大模型 HY-Embodied-0.5-X,賦能機器人智能交互
騰訊 Robotics X 與混元團隊聯合開源HY-Embodied-0.5-X多模態大模型,專爲機器人具身任務優化。該模型基於MoT-2B架構,強化“看懂、想清、做到”能力,在精細操作、空間推理、動作預測和風險判斷上表現突出。系列包含MoT-2B和MoE-32B兩個版本,旨在提升機器人在真實環境的智能交互水平。
Apr 27, 2026
232.2k
崑崙萬維發佈 “4+3 戰略”:從技術底座到商業閉環
崑崙萬維2025年報顯示,公司營收81.98億元,同比增長44.78%,海外收入77.23億元,增長49.91%。公司推出“4+3戰略”,明確了AI驅動內容生產的發展方向,涵蓋技術與商業佈局。
Apr 24, 2026
248.3k
阿里ATH事業羣HappyHorse模型登頂AI視頻榜,Elo積分力壓Seedance2.0
國產多模態模型“HappyHorse-1.0”在文本轉視頻評測中以1332分登頂,領先字節跳動模型近60分。其海外社交賬號首位關注者爲阿里巴巴,暗示其研發背景。
Apr 10, 2026
202.4k
美團發佈原生多模態 LongCat-Next:視覺語音實現底層統一
美團發佈原生多模態大模型LongCat-Next,突破傳統“語言基座+插件”架構,通過DiNA技術將圖像、語音與文本統一轉化爲同源離散Token,實現AI原生“看”與“聽”物理世界,完成多模態建模深度統一。
Apr 3, 2026
327.8k
