全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會(GDC)上,阿里雲魔搭社區重磅宣佈,首發上線階躍星辰最新開源的兩款多模態模型,包括

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會(GDC)上,阿里雲魔搭社區重磅宣佈,首發上線階躍星辰最新開源的兩款多模態模型,包括

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
近日,魔樂社區(Modelers)正式上線了由階躍星辰研發的 Step-Video 和 Step-Audio 兩款開源多模態大模型。這兩款模型分別用於視頻生成和語音交互,旨在爲開發者和企業用戶提供更強大的 AI 工具。Step-Video 模型的全名爲 Step-Video-T2V,這是一款參數量高達300億的全球最大開源視頻生成模型。該模型能夠直接生成204幀、540P 分辨率的高質量視頻,並在指令遵循、運動平滑性、物理合理性以及美感等方面,表現超越了市場上現有的頂尖開源視頻模型。另一方面,Step-Audio 則是業內首款能夠生成多種情
今日,階躍星辰與吉利汽車集團宣佈,聯合開源兩款階躍Step系列多模態大模型——Step-Video-T2V視頻生成模型和Step-Audio語音模型。其中,階躍Step-Video-T2V視頻生成模型在參數量和性能上均處於全球領先水平。該模型擁有300億參數量,能夠直接生成204幀、540P分辨率的高質量視頻,確保生成內容信息密度高、一致性強。評測結果顯示,Step-Video-T2V在指令遵循、運動平滑性、物理合理性、美感度等方面均表現出色,顯著超越市面上既有的最佳開源視頻模型。
Ovis2 是阿里巴巴國際化團隊提出的Ovis系列模型的最新版本。與前序1. 6 版本相比,Ovis2 在數據構造和訓練方法上都有顯著改進。它不僅強化了小規模模型的能力密度,還通過指令微調和偏好學習大幅提升了思維鏈(CoT)推理能力。此外,Ovis2 引入了視頻和多圖像處理能力,並增強了多語言能力和複雜場景下的OCR能力,顯著提升了模型的實用性。
埃隆·馬斯克(Elon Musk)旗下的人工智能公司xAI宣佈,其新成立的遊戲工作室將徹底改變遊戲行業的現狀。據悉,該工作室將利用最新發布的AI模型Grok3,讓遊戲開發變得前所未有的高效與便捷。用戶現已能夠在短短几分鐘內通過Grok3生成完整的遊戲,甚至只需簡單提問即可提升遊戲的圖形質量。圖源備註:圖片由AI生成,圖片授權服務商MidjourneyxAI遊戲工作室的這一創新引發了業界廣泛關注。報道稱,Grok3已展示出強大的遊戲生成能力,其中包括10款由AI驅動的遊戲範例。值得一提的是,首款
全球知名創意資源平臺Freepik宣佈與科技巨頭谷歌合作,率先在全球範圍內推出最新一代AI視頻模型——Veo 2。這一重磅消息迅速引發了廣泛關注,不少用戶紛紛表示,這可能是目前最先進的AI視頻生成工具。據介紹,Veo2 由谷歌DeepMind團隊研發,是其前代模型Veo的全面升級版。它不僅能生成高達4K分辨率的視頻,還能實現長達數分鐘的畫面內容。更令人驚歎的是,Veo2 在真實感和動畫流暢性上達到了新的高度。無論是模擬真實世界的物理效果,還是呈現細膩的人物動作和表情,這款工具都能做