全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會(GDC)上,阿里雲魔搭社區重磅宣佈,首發上線階躍星辰最新開源的兩款多模態模型,包括 全球參數量最大的開源視頻生成模型 Step-Video-T2V,以及 業界首款產品級開源語音交互模型 Step-Audio。 這一消息瞬間引爆全球AI開源社區,再次彰顯中國在人工智能領域的強勁創新實力。

作爲中國最大的AI模型社區,阿里雲魔搭社區此次發佈的這兩款重磅模型,無疑是近期全球多模態領域最受矚目的開源成果。 Step-Video-T2V 以其巨大的參數規模,一舉刷新了開源視頻生成模型的記錄,預示着更高質量、更精細化的視頻內容創作即將成爲現實。 而 Step-Audio 則突破了傳統語音模型的侷限,成爲業界首個產品級開源語音交互系統,意味着更自然、更智能的語音交互技術將加速普及應用。

音頻 聲波 智能語音

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

據官方介紹,截至目前,阿里雲魔搭社區已匯聚超過 4萬個開源模型,全面覆蓋了包括大語言模型(LLM)、對話系統、語音技術、文生圖、圖生視頻等多個前沿領域, 穩坐中國最大AI模型社區的頭把交椅。 此次選擇在魔搭社區開源這兩款極具分量的模型,不僅是對魔搭社區平臺實力的肯定,也體現了階躍星辰對開源生態建設的積極貢獻。

在GDC這一全球開發者矚目的舞臺上發佈如此重要的開源成果,無疑向世界展示了中國AI技術的蓬勃發展態勢和開放合作姿態。 這兩款模型的開源,將極大地降低AI技術的使用門檻,加速全球人工智能技術的普及和發展。