Pika 1.0 的宣传视频被一些用户认为是“炒作”,但不能否认,它们丰富了人们对多模态 AI 的想象力。多模态 AI 正处于爆发前夜,正走向场景化、实用化、商业化。Pika在技术上属于行业领先水平。Runway、Stability AI、Midjourney等公司也在布局AI视频生成赛道。多模态大模型有望打通物理世界和数字世界之间的屏障。
相关推荐
声智科技推全球首款“多模态AI时尚耳机”!声视融合,Kickstarter首发开启随身感知新时代
声智科技推出全球首款多模态AI时尚耳机,融合视觉与声学交互,突破传统耳机局限。该产品定位为“随身感知工具”,通过声视融合技术实现“看得见、听得清、回得准”,即将在Kickstarter全球首发。
2025年12月25号 11:11
156.3k
苹果发布全新多模态 AI 模型 UniGen 1.5,实现图像理解、生成与编辑三合一
苹果推出多模态AI模型UniGen1.5,整合图像理解、生成与编辑三大功能于统一框架,显著提升效率。该模型利用图像理解能力优化生成效果,实现技术突破。
2025年12月19号 9:26
182.6k
前字节跳动视觉模型负责人潘欣加盟美团,主导多模态 AI 创新
美团引入前字节跳动AI专家潘欣,负责多模态AI创新,以强化AI基础设施,应对激烈市场竞争。潘欣拥有谷歌大脑及百度等顶尖企业经验,将助力美团提升技术实力。
2025年12月11号 8:53
154.4k
腾讯发布全新视频生成模型 HunyuanVideo1.5,降低视频创作门槛
腾讯发布轻量级视频生成模型HunyuanVideo1.5,采用DiT架构,参数量8.3B,可生成5-10秒高清视频。该模型已在“元宝”平台上线,支持文字描述生成视频及图片结合文字生成功能,用户可体验多样化视频创作。
2025年11月21号 14:07
178.9k
ElevenLabs炸裂级更新:图像、视频、音乐一站式生成
多模态AI公司ElevenLabs推出集成式内容创作平台,融合图像生成、视频制作、声音合成、音乐创作和音效设计功能,实现从剧本到成品视频的一站式闭环生产,帮助创作者和营销人员告别多平台切换,高效完成商业视频制作。
2025年11月18号 13:57
189.2k
