阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。



阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。


华中科技大学学生团队借助自研AI平台“爱乌”,仅用48小时完成10分钟长视频《新江汉揽胜图》初剪版,展现高效创作能力。该视频浓缩江城千年历史,引发广泛关注。AI视频生成行业虽快速增长,但仍面临挑战。
商汤科技发布并开源日日新SenseNova U1系列模型,基于自研NEO-unify架构,实现多模态理解、推理与生成的深度统一,标志着从“集成式”向“原生统一”的跨越。该架构摒弃拼接式设计,去除视觉编码器和变分自编码器,提升了模型效率与性能。
OpenAI计划将视频生成器Sora整合进ChatGPT,以拓展多模态AI布局,强化视频创作能力,推动用户增长。目前ChatGPT周活约9.2亿,距10亿目标尚有差距。Sora的接入有望吸引短视频和视觉创作用户,应对谷歌Veo和Meta的竞争。
中国AI产业崛起,全球调用量首超美国。OpenRouter数据显示,2026年2月中国AI大模型周调用量超越美国,标志应用落地取得突破。
三星宣布将于2026年推出下一代AR眼镜,核心亮点是从“显示”转向“理解”,强调多模态AI体验,实现AI与现实环境的深度交互,提供更直观的智能辅助。