AI视频之战升级:Runway、Stability积极应对OpenAI的Sora


IBM发布Granite4.0Nano系列AI模型,参数规模350万至15亿,强调高效与可及性。模型可在笔记本电脑或浏览器本地运行,无需依赖云计算,支持开发者在普通硬件或边缘设备构建应用,突破行业依赖云服务的常规趋势。
Anthropic发布小型AI模型Claude Haiku4.5,以低成本实现接近前沿性能,专为实时低延迟任务设计,如聊天助手和客户服务。Claude系列含Haiku、Sonnet、Opus三种尺寸,大模型虽知识广但速度慢成本高,Haiku通过“蒸馏”技术平衡效率与性能。
据testingcatalog报道,近日,xAI 正式推出了 Grok4Fast,这是一款全新的模型,用户可以通过 Grok 网页版的模型选择器来访问。为了体验这一新功能,用户需要在订阅设置中启用一个新的早期访问模式切换按钮。Grok4Fast 最大的亮点在于其速度,用户反馈称该模型的响应速度比标准的 Grok4快了多达10倍。这一版本的主要特点是优化了快速响应,尽量减少在复杂任务上的处理时间。例如,当被要求创建一个机器人 SVG 时,Grok4Fast 会提供相对简单的输出,这表明该模型更注重速度,而非作品的复杂性。
MiniCPM-V4.0人工智能模型引发关注,这款4.1亿参数的新模型在视觉理解方面表现优异,OpenCompass评测得分69.0超越多款竞品。其最大亮点是专为移动设备优化,在iPhone16Pro Max上响应迅速且无发热问题。开发团队提供了iOS应用和详细指南,支持多种平台工具,让用户轻松上手使用。
近日,HPC-AI Tech 宣布推出 Open-Sora2.0,这是一款突破性的视频 AI 系统,仅需约十分之一的典型训练成本即可实现商业级质量。这一进展标志着在资源密集型的视频 AI 领域可能出现范式转变,堪比语言模型中出现的效率提升。虽然像 Movie Gen 和 Step-Video-T2V 这样现有的高质量视频生成系统可能需要数百万美元的训练费用,但 Open-Sora2.0的训练支出仅约为20万美元。尽管成本大幅降低,但测试表明,其输出质量可与 Runway Gen-3Alpha 和 HunyuanVideo 等已建立的商业系统相媲美。该系统使用了224个 Nvidia H20