站長之家(ChinaZ.com)6月21日 消息:騰訊混元文生圖大模型(混元 DiT 模型)宣佈全面開源訓練代碼,包括 LoRA 插件和 ControlNet 插件。
LoRA 是一種用於微調大型語言模型的技術,可以在不修改原有模型或增加模型大小的情況下,利用少量數據訓練出具有特定特徵的模型。

ControlNet 是一種可控化生成算法,允許用戶通過添加額外條件來更好地控制圖像生成。騰訊混元提供了三個首發 ControlNet 模型,可以提取與應用圖像的邊緣、深度和人體姿勢等條件。
此外,混元 DiT 發佈了專屬加速庫,提升推理效率並簡化使用方式。混元 DiT 已被廣泛用於素材創作、商品合成、遊戲出圖等多個領域,包括騰訊廣告妙思平臺和多家媒體使用混元 DiT 模型進行內容生成。
官網:
https://dit.hunyuan.tencent.com/
代碼:
https://github.com/Tencent/HunyuanDiT
模型:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
論文:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
數據製作流程:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
