新視頻生成技術AnimateAnything：支持控制鏡頭軌跡、文本提示等

在視頻創作領域，如何實現一致且可控的動畫效果一直是研究者們關注的重點。近日，研究團隊推出了名爲 “AnimateAnything” 的新方法，旨在通過精準的視頻操作，使動畫創作更加靈活和高效。該技術可以在不同的條件下，如攝像機軌跡、文本提示和用戶動作註釋等，進行精確的視頻處理。

“AnimateAnything” 通過設計一種多尺度控制特徵融合網絡，構建了一個統一的運動表示。這一網絡能夠將所有控制信息轉化爲逐幀的光流，從而指導視頻的生成。在這個過程中，光流作爲運動先驗，幫助提升動畫的一致性和穩定性。

爲了解決大規模運動帶來的閃爍問題，研究團隊還引入了一種基於頻率的穩定模塊。這個模塊通過確保視頻頻域的一致性，增強了視頻的時間連貫性，使得動畫效果更加自然。

在一系列實驗中，“AnimateAnything” 展現出優於現有技術的卓越性能。例如，在人臉動畫的生成中，該方法能夠實現更高的真實感和細膩度。此外，在與其他技術如 CameraCtrl 和 MotionCtrl 的對比中，AnimateAnything 均表現出色，展示了其在多種應用場景下的適用性和靈活性。

該技術的推出，標誌着視頻生成技術向前邁出了重要一步。未來，隨着該方法的不斷優化和推廣，預計將爲更多創作者提供強大的支持，推動視頻內容創作的創新和發展。

劃重點:
🧙‍♂️ AnimateAnything 通過多尺度控制特徵融合網絡，實現了精準的動畫效果生成。
🎥 該技術能夠在不同條件下（如攝像機軌跡和用戶動作）進行視頻處理，提升了一致性。
🌟 引入的頻率穩定模塊解決了大規模運動帶來的閃爍問題，增強了動畫的自然度。

新AI方法DELTA：10倍速度精確追蹤單鏡頭視頻中的每個像素

在視頻處理領域，如何從單鏡頭視頻中高效追蹤三維運動一直是一項難題，尤其是在需要對長序列進行像素級精確追蹤時。傳統方法面臨多重挑戰，往往只能跟蹤少量關鍵點，無法實現完整場景的細緻理解。而且，現有技術的計算需求較高，難以在處理長視頻時保持效率。同時，長時間的跟蹤也會受到相機移動和物體遮擋等問題的影響，導致跟蹤失誤或錯誤的產生。當前，視頻序列運動估計的方法各有優缺點。光流技術提供了密集的像素追蹤，但在複雜場景中，尤其是處理長序列時表現出

阿里新技術MIMO：一張圖片+視頻紙片人瞬間變動漫男神

阿里巴巴集團智能計算研究院最新推出的MIMO技術，正在徹底改變我們創造動畫角色的方式。這項創新工具僅需一張靜態圖片和簡單的動作指令，就能在短短几分鐘內將其轉化爲可操控的虛擬角色，無論是真人、卡通還是擬人化角色，都能輕鬆駕馭。比如你給它一段打籃球的視頻，然後給一張卡通人物的圖片，簡單的指令，就可以讓紙片人替換視頻裏的真實人物，紙片人瞬間就有了生命力。即使是真實的人物替換真實的人物，MIMO也可以做到完美替換，毫無違和感。MIMO的核心優勢在於其簡便

Stability AI發佈單一視頻轉換多視圖視頻的生成模型：Stable Video 4D

近日，Stability AI公司宣佈推出一項革命性的視頻處理技術——Stable Video4D。該技術能夠將單一視角的視頻轉換成8個不同角度的新視角視頻，爲創作者提供了前所未有的靈活性和創造力。Stable Video4D建立在該公司此前推出的Stable Video Diffusion模型基礎之上。與將圖像轉換爲視頻不同，新模型可以接收視頻輸入，並生成多個新視角的視頻輸出，實現了從基於圖像的視頻生成向全3D動態視頻合成的重大飛躍。

索尼互動娛樂收購AI視頻處理公司iSIZE

["索尼互動娛樂收購總部在英國的AI視頻處理公司iSIZE。","iSIZE利用深度學習爲媒體行業構建解決方案,提升編碼質量,降低比特率。","收購將爲索尼增加視頻處理方面的機器學習專業知識。","有利於索尼的一系列研發工作和視頻流媒體服務。","iSIZE的技術有望提升PS Plus高級會員的遊戲流服務質量。"]

爆火「視頻版 ControlNet」開源了！靠提示詞精準換畫風，全華人團隊出品

{"title":"爆火「視頻版 ControlNet」開源了！靠提示詞精準換畫風，全華人團隊出品","list":["全華人團隊打造的最新視頻處理算法 CoDeF 發佈後迅速在網上爆火","CoDeF 能根據提示詞精準控制視頻的畫風，並保持口型一致","CoDeF 通過內容形變場實現視頻風格遷移任務，並具有良好的跨幀一致性"]}