全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會(GDC)上,阿里雲魔搭社區重磅宣佈,首發上線階躍星辰最新開源的兩款多模態模型,包括

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會(GDC)上,阿里雲魔搭社區重磅宣佈,首發上線階躍星辰最新開源的兩款多模態模型,包括

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
近日,魔樂社區(Modelers)正式上線了由階躍星辰研發的 Step-Video 和 Step-Audio 兩款開源多模態大模型。這兩款模型分別用於視頻生成和語音交互,旨在爲開發者和企業用戶提供更強大的 AI 工具。Step-Video 模型的全名爲 Step-Video-T2V,這是一款參數量高達300億的全球最大開源視頻生成模型。該模型能夠直接生成204幀、540P 分辨率的高質量視頻,並在指令遵循、運動平滑性、物理合理性以及美感等方面,表現超越了市場上現有的頂尖開源視頻模型。另一方面,Step-Audio 則是業內首款能夠生成多種情
今日,階躍星辰與吉利汽車集團宣佈,聯合開源兩款階躍Step系列多模態大模型——Step-Video-T2V視頻生成模型和Step-Audio語音模型。其中,階躍Step-Video-T2V視頻生成模型在參數量和性能上均處於全球領先水平。該模型擁有300億參數量,能夠直接生成204幀、540P分辨率的高質量視頻,確保生成內容信息密度高、一致性強。評測結果顯示,Step-Video-T2V在指令遵循、運動平滑性、物理合理性、美感度等方面均表現出色,顯著超越市面上既有的最佳開源視頻模型。
李亮指出,一篇題爲《字節AI團隊大變陣》的文章中存在多處不實信息。文章中提及的技術副總裁楊震原即將退休、馮佳時將離職創業等說法,均爲錯誤信源所致。此外,關於張一鳴拜訪豌豆莢創始人王俊煜及上海模速空間創業公司的報道,同樣與事實不符。
蘋果公司於今日凌晨通過官方網站發佈消息,透露Apple智能功能即將迎來重大更新,支持語言範圍顯著擴大。此次新增支持的語言包括法語、德語、意大利語、葡萄牙語(巴西)、西班牙語、日語、韓語以及簡體中文,同時還將推出新加坡與印度本地化英語版本。
OpenAI 於上週五宣佈,正在爲澳大利亞、巴西、加拿大、印度、日本、新加坡、韓國、英國等多個國家的 ChatGPT Pro 用戶推出其最新的人工智能代理工具 ——Operator。這一工具的推出標誌着 OpenAI 在人工智能領域的一次重要擴展,旨在幫助用戶更高效地完成各種日常任務。Operator 自今年1月在美國首次推出以來,便備受關注,成爲市場上少數能夠代表用戶執行任務的 “人工智能代理” 之一。它能夠完成多種操作,包括訂票、預訂餐廳、提交費用報告,甚至在電子商務網站上購物。這些功能不僅