AI視頻生成賽道再起波瀾。xAI旗下AI助手Grok今日正式推出重磅升級——Grok Imagine全面支持純文本生成短視頻,用戶僅需輸入一句描述(如“賽博朋克城市中飛馳的摩托車”),17秒內即可獲得帶背景音效、動態鏡頭與專業畫質的6-15秒視頻片段,無需任何圖像輸入或編輯基礎。這一能力不僅徹底打通“想法到成片”的最後一環,更以碾壓級速度直指OpenAI Sora與Google Veo的市場地位。

17秒成片,速度碾壓行業
據實測,Grok Imagine在v0.9模型優化後,文字生成視頻平均耗時不足17秒,圖像轉視頻更實現“秒級響應”,大幅領先當前主流競品。生成內容支持16:9、9:16、3:2等多種寬高比,完美適配TikTok、Instagram、演示文稿等場景。視頻質量同步提升,動作流暢度、光影一致性與音畫同步率均達新高,連情緒氛圍(如“緊張”“夢幻”)也能精準呈現。

不止生成,更懂創作:多模態交互閉環
Grok Imagine並非“一次性輸出”工具,而是強調人機共創:
靜態圖秒變動態視頻:上傳一張圖片,AI自動添加運鏡、粒子效果與環境音;
多風格自由切換:支持寫實、動漫、抽象藝術等渲染模式;
創意模式加持:內置“Spicy Mode”(開放創意邊界)與Meme模式,滿足娛樂化表達;
實時迭代優化:生成後可調整提示詞,精細控制運動軌跡、色調甚至角色表情。
這一切依託xAI自研的Aurora多模態引擎,深度融合文本理解、視覺生成與音頻合成,確保輸出內容連貫性超95%,被早期用戶稱爲“最像人類協作的AI視頻工具”。
全平臺覆蓋,訂閱即用
該功能現已上線Grok Web端及iOS/Android App。免費用戶每日可限量生成,而Heavy/SuperGrok訂閱用戶則享無上限訪問、高清導出及優先隊列。xAI創始人埃隆·馬斯克更在X平臺親自預熱,稱這是“Grok向真正多模態智能體的關鍵飛躍”,並預告未來將加入視頻延長、剪輯與多鏡頭編排功能。
應用場景全面爆發
內容創作者:輸入“搞笑貓咪追激光”,秒出豎屏爆款視頻;
營銷團隊:用文字快速生成產品功能演示,節省外包成本;
教育工作者:一鍵創建歷史事件或科學原理的動態再現;
開發者:API開放後,可嵌入App實現個性化視頻流生成。
AIbase認爲,Grok Imagine的真正顛覆性,在於將視頻創作從“專業技能”降維爲“表達本能”。當17秒就能把腦洞變成視聽內容,AI不再是工具,而是每個人的創意分身。在Sora尚未全面開放之際,xAI已憑藉速度、易用性與生態整合,悄然搶佔多模態內容創作的制高點。這場由文字點燃的視頻革命,纔剛剛開始。
