智譜正式宣佈聯合華爲開源新一代圖像生成模型

GLM-Image 支持在單個模型中同時進行文本到圖像和圖像到圖像的生成。
- 文本轉圖像:根據文本描述生成高細節圖像,在信息密集的場景中表現尤爲出色。
- 圖像到圖像:支持多種任務,包括圖像編輯、風格遷移、多主體一致性以及人物和物體的身份保留生成。
在技術指標上,
目前,


GitHub:https://github.com/zai-org/GLM-Image
Hugging Face:https://huggingface.co/zai-org/GLM-Image
劃重點:
🇨🇳 國產全棧自研:基於華爲昇騰 Atlas800T A2設備與昇思 MindSpore 框架完成全流程訓練,驗證了國產算力訓練頂尖模型的可行性。
🎨 文圖融合突破:採用混合架構,在 LongText-Bench 等長文本渲染榜單中獲得開源第一,大幅提升了漢字與複雜圖文的生成準確率。
💰 高性價比開源:模型支持多種分辨率自適應生成,並以極低的 API 價格向創作者開放,旨在推動國產認知型生成技術的普及。
