騰訊混元發佈了其最新的生圖模型 “混元圖像2.1(HunyuanImage2.1)”。這一全新的開源文生圖模型在多個方面進行了重要升級,支持原生2K 分辨率圖像生成,旨在爲設計師和視覺創作者提供更高效、更便捷的創作工具。

image.png

在這次更新中,混元圖像2.1在性能與生成效果之間找到了更好的平衡。它不僅支持中英文原生輸入,還能生成高質量的複雜語義文本。這一特性讓創作者能夠輕鬆生成多樣化的圖像作品,無論是精美的插畫、富有創意的海報,還是多樣的漫畫形式,都能快速實現。

混元圖像2.1的升級還得益於其龐大的圖文對齊數據集,使得模型在複雜語義理解和跨領域泛化能力上有了顯著提升。它支持最長1000個 tokens 的提示詞,可以精準生成場景細節、人物表情和動作,允許對多物體進行分別描述和控制。此外,新模型在處理圖像中的文字信息方面也表現出色,能夠自然地將文字與畫面相融合,提升了作品的整體美感。

作爲一款開源模型,混元圖像2.1的代碼和權重已經在 Hugging Face 和 GitHub 等平臺上發佈。個人和企業開發者都可以基於這一基礎模型進行進一步的研究和開發,滿足不同的衍生需求。未來,騰訊還透露了一款原生多模態圖像生成模型正在研發中,值得期待。

image.png

混元圖像2.1的發佈將爲視覺創作者帶來更豐富的創作工具,助力他們在創意實現的道路上更進一步。

【相關鏈接】

    • 騰訊混元官網:https://hunyuan.tencent.com/image

    • Github:https://github.com/Tencent-Hunyuan/HunyuanImage-2.1

    • Hugging Face:https://huggingface.co/tencent/HunyuanImage-2.1

    • Hugging Face Demo:https://huggingface.co/spaces/tencent/HunyuanImage-2.1

    劃重點:  

    🌟 支持原生2K 分辨率,提升圖像生成質量與效率。  

    🖊️ 具備強大的複雜語義理解能力,支持高質量的文本生成。  

    🔧 開源模型已上線,開發者可基於其進行研究與開發。