在人工智能領域,技術迭代的速度總是令人驚歎。快手旗下AI視頻生成工具可靈(Kling)在短短半年內,從追趕者一躍成爲全球AI視頻生成領域的領跑者。最新發佈的1.6版本,展現了令人矚目的技術進步。

儘管版本號僅提升了0.1,但可靈1.6版帶來的技術突破卻遠超預期。新版本在保持35靈感/5秒視頻的親民價格基礎上,在三個核心維度實現了質的飛躍:物理規律真實感、人物表演能力和語義理解水平。

QQ20241219-111043.jpg

物理規律真實感大幅提升

對物理世界的精準演繹是這次更新的最大亮點。在切西紅柿的測試中,可靈1.6版展現出近乎專業廚師的精準操作,無論是刀具與食材的互動,還是切片的力度都令人歎服。倒茶、貓咪踩沙發、狗狗奔跑等日常場景中的物理效果也更加真實。甚至連蝙蝠俠飆車時披風的飄動都充滿了電影感,真實度和藝術感兼具。

人物表情和動作的進步同樣令人驚豔。從細微的眉頭皺起到優雅的芭蕾舞姿,再到極具挑戰的中國古典水下舞蹈,可靈1.6版都能準確捕捉人物細微的情感變化和複雜的肢體動作。在河南衛視《洛神》水下舞蹈片段的重現中,舞者的動作幅度和服飾飄帶的物理效果都達到了驚人的水準。

在語義理解方面,可靈1.6版展現出更強的場景理解能力。無論是“摘下眼鏡擁抱小鹿”這樣的連續動作,還是“後退舉槍”等複雜場景,都能準確理解並生成符合預期的視頻內容,體現了其對複雜指令的出色解析能力。

當然,作爲0.1版本的更新,可靈1.6版仍有提升空間。例如,在生成原圖之外的內容時,畫風的統一性還需加強;多人物場景下的手部細節處理仍有待改進。但這瑕不掩瑜,這次更新已經充分展示了可靈團隊紮實的技術功底和快速迭代的能力。

從6月份正式上線至今,可靈在短短半年內完成了從“中國的Sora”到“世界的可靈”的蛻變。在全球AI視頻生成賽道上,這個來自快手的產品正在書寫屬於中國科技的新篇章。我們有理由相信,在即將到來的2.0版本中,可靈還將帶給我們更多驚喜。