2026年3月11日,全球 AI 视觉领域的领军人物、DiT(Diffusion Transformers)作者谢赛宁及其团队正式发布了全球首个多人视频世界模型——Solaris。这一突破性进展不仅验证了多玩家在虚拟世界中的协同感知能力,更标志着视频生成模型从“单人单视角”向“多人交互世界”的跨越。
技术底座:引入多人自注意力层,建筑一致性大幅提升
Solaris的核心技术架构基于昆仑天工于2025年8月开源的实时长序列交互式生成世界模型 Matrix-Game2.0。
相比于此前唯一的多人方案 Multiverse,Solaris引入了创新的“多人自注意力层”,实现了不同玩家之间的实时信息交换。在《我的世界》(Minecraft)的测试场景中,该模型在处理建筑一致性、视觉对齐等复杂挑战时表现优异,确保了多名玩家在同一空间交互时画面不发生崩塌。

资本狂欢:AMI 公司融资10亿美元,杨立昆坐镇总部巴黎
随着Solaris的亮相,谢赛宁联合创立的 AI 初创公司 AMI 也揭开了神秘面纱。该公司由图灵奖得主、前 Meta 首席 AI 科学家杨立昆(Yann LeCun)于2026年1月正式创立,总部位于法国巴黎。
消息显示,AMI 公司已完成高达 10.3亿美元 的种子轮融资,融资前估值已飙升至 35亿美元。谢赛宁在公司内担任联合创始人兼首席科学官(CSO),负责核心技术的研发方向。
开源生态:助力全球开发者构建多人视频场景
依托Matrix-Game2.0的开源方案,Solaris的发布为游戏开发、虚拟现实以及具身智能训练提供了全新的可能性。目前,Solaris的相关资源已向开发者开放下载,有望推动视频生成技术从“看视频”向“演视频”的交互式变革。
当 AI 能够理解并生成多人协作的动态世界,我们距离真正的“高保真虚拟现实”或许又近了一大步。