全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括

图源备注:图片由AI生成,图片授权服务商Midjourney

全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括

图源备注:图片由AI生成,图片授权服务商Midjourney
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强大的 AI 工具。Step-Video 模型的全名为 Step-Video-T2V,这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频,并在指令遵循、运动平滑性、物理合理性以及美感等方面,表现超越了市场上现有的顶尖开源视频模型。另一方面,Step-Audio 则是业内首款能够生成多种情
今日,阶跃星辰与吉利汽车集团宣布,联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。其中,阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。该模型拥有300亿参数量,能够直接生成204帧、540P分辨率的高质量视频,确保生成内容信息密度高、一致性强。评测结果显示,Step-Video-T2V在指令遵循、运动平滑性、物理合理性、美感度等方面均表现出色,显著超越市面上既有的最佳开源视频模型。
OpenAI 于上周五宣布,正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展,旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来,便备受关注,成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作,包括订票、预订餐厅、提交费用报告,甚至在电子商务网站上购物。这些功能不仅
OpenAI 于周五宣布,将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家,为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务,包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出,作为市场上几款 “人工智能代理” 工具之一,OpenAI 希望通过这一产品,为用户提供更便捷的服务。需要注意的是,这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放,用户可以通过
百度旗下的文心智能体平台宣布全面接入DeepSeek模型,并向所有用户免费开放。文心智能体平台是百度推出的基于文心大模型的智能体构建平台,旨在帮助用户快速创建和部署智能体应用。