騰訊正式發佈其最新的混元圖像2.0模型(Hunyuan Image2.0),標誌着 AI 圖像生成技術邁入 “毫秒級” 響應時代。

image.png

新模型在速度上有了顯著提升,相比於前代產品,混元圖像2.0的參數量提高了一個數量級,結合了高效的圖像編解碼器和全新的擴散架構,能夠在同類商業產品通常需要5到10秒的推理速度下,實現毫秒級的快速響應。用戶在生成圖像時,可以一邊輸入文本或進行語音指令,一邊獲得實時圖像輸出,極大地改變了傳統的 “抽卡 - 等待 - 抽卡” 模式,提升了用戶的交互體驗。

image.png

超寫實的圖像質量 

除了速度上的突破,混元圖像2.0在圖像生成的質量方面也有顯著進步。該模型通過強化學習和引入大量人類美學知識,有效避免了 AI 生成圖像常見的 “AI 味”,生成的圖像不僅真實感強,細節豐富,且具有很高的可用性。在國際權威的 GenEval 基準測試中,混元圖像2.0在複雜文本指令的理解與生成能力評估中準確率超過95%,遠超其他同類模型。

創新的實時繪畫板功能 

本次升級還推出了實時繪畫板功能,利用新模型的實時生圖能力,用戶在繪製線稿或調整參數時,預覽區能夠同步生成上色效果。這一功能突破了傳統的 “繪製 - 等待 - 修改” 流程,極大地便利了專業設計師的創作過程。此外,實時繪畫板支持多圖融合,用戶可以上傳多個草圖,AI 將自動協調透視與光影,按照用戶的提示詞生成融合圖像,進一步豐富了 AI 生圖的互動體驗。

image.png

騰訊還透露,原生多模態圖像生成大模型正在研發中,新模型將在多輪圖像生成和實時交互體驗等方面表現出色,期待爲用戶帶來更爲豐富的創作體驗。

產品入口:https://hunyuan.tencent.com/