2月26日,谷歌Deep Mind团队发布基础世界模型Genie,一个虚拟生成的可交互环境,110 亿参数,通过给模型投喂视频数据进行训练,生成照片、草图甚至可以操控的虚拟世界。Genie是在没有任何动作标签的情况下进行训练的,而传统AI是需要人给图片打标签来训练AI识别图片。这意味着Genie需要从视频中自行识别不同动作的特征和模式。Genie生成的视频卡通化,可模拟机器人动作与变形物体,较Sora更偏向动图。谷歌表示Genie具有挑战性,能够学习细颗粒度的控制,从互联网视频中学习。Genie还可以模拟多种潜在动作,根据生成的环境推测出不同动作。
相关推荐
印度数据中心快速发展面临人才短缺挑战
印度数据中心行业快速发展,预计十年内容量翻倍,但面临人才短缺挑战,毕业生技能难以满足实际运营需求。数据中心对支持云计算、人工智能等数字经济至关重要。为此,企业正加强员工培训以提升技能,应对未来需求。
2025年12月23号 15:42
108.5k
Alphabet 斥资 47.5 亿美元收购 Intersect,加码 AI 算力的绿色能源引擎
谷歌母公司Alphabet以47.5亿美元收购清洁能源开发商Intersect,以应对AI算力激增带来的电力需求。此举凸显科技巨头在AI竞赛中对稳定能源供应的迫切需求。
2025年12月23号 9:06
99.2k
日本女子听取ChatGPT建议,与 AI 游戏角色结婚
日本女子与AI游戏角色结婚,引发人机关系讨论。她因ChatGPT建议结束订婚,后创造数字伴侣并举办婚礼。
2025年12月23号 9:02
96.4k
谷歌推出 A2UI 标准,让 AI 实时生成用户界面
谷歌推出A2UI新标准,让AI能直接生成图形界面元素,如按钮和表单,提升交互体验。传统AI交互依赖文本,处理复杂任务繁琐。A2UI开源项目规范AI生成视觉响应,使客服等场景能即时创建界面,简化操作流程。
2025年12月22号 16:50
214.5k
谷歌推出A2UI开放标准:让AI代理秒变"界面设计师",告别枯燥文字对话
谷歌推出A2UI开放标准,让AI代理能即时生成图形界面元素,如表单和按钮,无缝融入应用,实现从纯文本到动态界面的交互变革。该标准采用Apache 2.0许可证,旨在规范AI创建视觉响应的方式,弥合生成式AI与图形用户界面之间的鸿沟。
2025年12月22号 10:57
175.1k
