圖森未來發布圖生視頻模型“Ruyi” 並開源Ruyi-Mini-7B

北京圖森未來科技有限公司於2024年12月17日正式發佈了其首款“圖生視頻”大模型——“Ruyi”，並將Ruyi-Mini-7B版本開源，以便用戶從huggingface平臺下載使用。圖森未來成立於2015年，總部位於美國加利福尼亞州聖迭戈，專注於AI技術在多個行業的應用，包括動畫遊戲和交通運輸行業。

Ruyi大模型專爲在消費級顯卡上運行而設計，提供詳盡的部署說明和ComfyUI工作流，以便用戶快速上手。該模型以其在幀間一致性、動作流暢性、色彩呈現和構圖方面的卓越表現，爲視覺敘事提供新的可能性，並針對動漫和遊戲場景進行深度學習，成爲ACG愛好者的理想創意夥伴。

微信截圖_20241217140324.png

Ruyi模型支持多分辨率、多時長生成，能夠處理從384×384到1024×1024的分辨率，任意長寬比，最長120幀/5秒的視頻生成。它還支持首幀、首尾幀控制生成，運動幅度控制，以及五種鏡頭控制。Ruyi基於DiT架構，由Casual VAE模塊和Diffusion Transformer組成，總參數量約爲7.1B，使用約200M視頻片段進行訓練。

儘管Ruyi在技術上取得了顯著進展，但仍存在一些缺陷，如手部畸形、多人時面部細節崩壞、不可控轉場等問題，圖森未來正在努力改進並在未來的更新中修復這些問題。

展望未來，圖森未來計劃持續深耕場景需求，實現直接生成CUT的突破，並在下一次發佈中提供兩個版本，以滿足不同創作者的需求。公司致力於利用大模型降低動漫和遊戲內容的開發週期和成本，Ruyi大模型已經能夠實現輸入關鍵幀後生成5秒內容，或輸入兩個關鍵幀由模型生成中間過渡內容，降低開發週期。

Hugging Face 鏈接 :

https://huggingface.co/IamCreateAI/Ruyi-Mini-7B

騰訊混元遊戲視覺生成平臺正式發佈2.0版本

騰訊混元遊戲視覺生成平臺2.0版本正式發佈，新增遊戲圖生視頻、自定義模型訓練、角色精修等功能，大幅提升2D生圖能力，圖生視頻和文生圖模型達到行業領先水平。升級解決了遊戲美術設計與宣發中的動態內容生成、風格定製和細節優化等痛點，提升設計師效率。平臺界面簡潔，用戶體驗友好。

LiblibAI接入阿里通義大模型，賦能2000萬創作者的新紀元

在中國 AI 圖像創作領域，LiblibAI 平臺近日迎來了一個重大升級。該平臺正式接入了阿里巴巴的通義系列大模型，進一步拓寬了其在 AI 圖像生成與視頻創作方面的能力。這一舉措不僅是對 AI 技術的一次重大推進，也爲廣大的創作者羣體帶來了福音。據官方消息，LiblibAI 此次整合了萬相最新的開源模型，推出了文生視頻和圖生視頻功能。用戶只需輸入提示詞或上傳圖片，系統便能夠生成10秒鐘的動態視頻，極大地提升了創作的效率和趣味性。同時，這項技術已經在 Hugging Face 及魔搭社區獲得了

運動可控！階躍星辰 Step-Video-TI2V 圖生視頻模型開源

上海階躍星辰智能科技有限公司宣佈開源其最新的圖生視頻模型——Step-Video-TI2V。這一模型是基於30B參數的Step-Video-T2V訓練而成，能夠生成102幀、5秒、540P分辨率的視頻，具有運動幅度可控和鏡頭運動可控兩大核心特點，尤其在動漫效果方面表現出色。

阿里媽媽推出淘寶星辰視頻生成大模型、圖生視頻應用

近日，阿里媽媽基於自研的淘寶星辰視頻生成大模型，正式推出了商用級圖生視頻AI Native應用——淘寶星辰·圖生視頻，並已對淘寶天貓商家開放使用。這一全新的AI Native工具結合了海量電商數據、豐富的設計語言以及業內領先的營銷經驗，旨在推動電商AI內容創作的全流程智能化升級。

可靈AI平臺 1.5 模型升級：上線人臉模型功能新增「標準模式」

快手旗下可靈AI平臺宣佈其1.5模型全新升級，引入了一系列創新功能，此次升級包括圖生視頻高品質模式的增強，支持運動筆刷和運鏡，以及新增的標準模式，爲用戶提供了高性價比的選擇。在高品質模式中，用戶可以爲圖片中的元素指定運動軌跡，添加運動軌跡和靜止區域，實現更精細的控制。同時，平臺提供了六種運鏡方式，包括水平運鏡、垂直運鏡、拉遠/推進和旋轉運鏡，以滿足不同創作需求。