阿里雲魔搭首發上線階躍星辰最新開源的兩款多模態模型

全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會（GDC）上，阿里雲魔搭社區重磅宣佈，首發上線階躍星辰最新開源的兩款多模態模型，包括 全球參數量最大的開源視頻生成模型 Step-Video-T2V，以及 業界首款產品級開源語音交互模型 Step-Audio。這一消息瞬間引爆全球AI開源社區，再次彰顯中國在人工智能領域的強勁創新實力。

作爲中國最大的AI模型社區，阿里雲魔搭社區此次發佈的這兩款重磅模型，無疑是近期全球多模態領域最受矚目的開源成果。 Step-Video-T2V 以其巨大的參數規模，一舉刷新了開源視頻生成模型的記錄，預示着更高質量、更精細化的視頻內容創作即將成爲現實。而 Step-Audio 則突破了傳統語音模型的侷限，成爲業界首個產品級開源語音交互系統，意味着更自然、更智能的語音交互技術將加速普及應用。

音頻聲波智能語音

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

據官方介紹，截至目前，阿里雲魔搭社區已匯聚超過 4萬個開源模型，全面覆蓋了包括大語言模型（LLM）、對話系統、語音技術、文生圖、圖生視頻等多個前沿領域，穩坐中國最大AI模型社區的頭把交椅。此次選擇在魔搭社區開源這兩款極具分量的模型，不僅是對魔搭社區平臺實力的肯定，也體現了階躍星辰對開源生態建設的積極貢獻。

在GDC這一全球開發者矚目的舞臺上發佈如此重要的開源成果，無疑向世界展示了中國AI技術的蓬勃發展態勢和開放合作姿態。這兩款模型的開源，將極大地降低AI技術的使用門檻，加速全球人工智能技術的普及和發展。

華爲昇騰攜手階躍星辰推出開源多模態模型，進軍 AI 新領域

近日，魔樂社區（Modelers）正式上線了由階躍星辰研發的 Step-Video 和 Step-Audio 兩款開源多模態大模型。這兩款模型分別用於視頻生成和語音交互，旨在爲開發者和企業用戶提供更強大的 AI 工具。Step-Video 模型的全名爲 Step-Video-T2V，這是一款參數量高達300億的全球最大開源視頻生成模型。該模型能夠直接生成204幀、540P 分辨率的高質量視頻，並在指令遵循、運動平滑性、物理合理性以及美感等方面，表現超越了市場上現有的頂尖開源視頻模型。另一方面，Step-Audio 則是業內首款能夠生成多種情

效果最佳！階躍星辰開源Step-Video-T2V 視頻生成模型

今日，階躍星辰與吉利汽車集團宣佈，聯合開源兩款階躍Step系列多模態大模型——Step-Video-T2V視頻生成模型和Step-Audio語音模型。其中，階躍Step-Video-T2V視頻生成模型在參數量和性能上均處於全球領先水平。該模型擁有300億參數量，能夠直接生成204幀、540P分辨率的高質量視頻，確保生成內容信息密度高、一致性強。評測結果顯示，Step-Video-T2V在指令遵循、運動平滑性、物理合理性、美感度等方面均表現出色，顯著超越市面上既有的最佳開源視頻模型。

OpenAI 在全球擴展人工智能代理服務Operator，提升用戶體驗

OpenAI 於上週五宣佈，正在爲澳大利亞、巴西、加拿大、印度、日本、新加坡、韓國、英國等多個國家的 ChatGPT Pro 用戶推出其最新的人工智能代理工具 ——Operator。這一工具的推出標誌着 OpenAI 在人工智能領域的一次重要擴展，旨在幫助用戶更高效地完成各種日常任務。Operator 自今年1月在美國首次推出以來，便備受關注，成爲市場上少數能夠代表用戶執行任務的 “人工智能代理” 之一。它能夠完成多種操作，包括訂票、預訂餐廳、提交費用報告，甚至在電子商務網站上購物。這些功能不僅

OpenAI宣佈面向多個國家推出AI代理 Operator

OpenAI 於週五宣佈，將在包括澳大利亞、巴西、加拿大、印度、日本、新加坡、韓國和英國等多個國家，爲 ChatGPT Pro 用戶推出一款名爲 “Operator” 的人工智能代理工具。此工具旨在幫助用戶更高效地完成各類任務，包括訂票、預訂餐廳、提交費用報告和網上購物等。“Operator” 最初於今年1月在美國推出，作爲市場上幾款 “人工智能代理” 工具之一，OpenAI 希望通過這一產品，爲用戶提供更便捷的服務。需要注意的是，這一工具目前僅對每月付費200美元的 ChatGPT Pro 用戶開放，用戶可以通過

阿里雲魔搭首發上線階躍星辰最新開源的兩款多模態模型

相關推薦

華爲昇騰攜手階躍星辰推出開源多模態模型，進軍 AI 新領域

效果最佳！階躍星辰開源Step-Video-T2V 視頻生成模型

OpenAI 在全球擴展人工智能代理服務Operator，提升用戶體驗

OpenAI宣佈面向多個國家推出AI代理 Operator

全部免費！百度文心智能體平臺已全面接入DeepSeek模型