近日,阿里巴巴ATH創新事業部研發的新一代多模態視頻生成模型HappyHorse正式開啓灰度測試。作爲全球AI視頻領域的有力競爭者,該模型在Arena.ai的文生視頻、圖生視頻及視頻編輯三大核心榜單中均展現出不俗的競技實力。
影視級畫質與深度語義理解
HappyHorse主打“影視級”視覺表現,支持1080P超高清輸出。它能夠精準駕馭多種視覺風格,無論是極具年代感的港式風情、宏大的古裝氛圍,還是新中式動漫效果,都能通過細膩的光影和自然的鏡頭運動予以還原。

在技術底層,該模型具備極強的語義解析能力,可處理長達800詞的複雜指令,並支持同時輸入9張參考圖,從而確保人物形象、場景構件及道具細節的穩定性。據悉,生成一段15秒的高質量劇情視頻,僅需2至5分鐘。
實現音畫同步的“一鍵成片”
除了視覺層面的突破,HappyHorse在多語言適配與音畫互動上也表現出色。它兼容粵語、英語、法語等多語種創作,能使角色的口型、表情與肢體動作高度契合。更具亮點的是,模型可根據畫面內容自動生成環境音效與背景音樂,真正實現音畫同步的自動化創作流。
中文在線“次元神筆”完成接入,擴充AI工具箱
在模型開啓測試的同時,國內數字內容領先企業中文在線也宣佈,旗下全棧AI內容創作解決方案“次元神筆”已正式接入HappyHorse模型。
此前,“次元神筆”已集成了包括Seedance2.0在內的多款行業頂尖模型。通過引入HappyHorse,中文在線進一步構建了覆蓋文本、圖像、視頻的全維度創作生態。此舉旨在爲創作者提供更多樣化的工具選擇,降低高質量內容產出的門檻,助力優質IP實現跨形態的快速轉化。
隨着全球AI技術的迭代,此類工具的普及或將重塑影視與短視頻的創作邏輯。
