近日,美团 LongCat 团队宣布推出 LongCat-Image 图像生成模型,并将其开源。这一新模型以6B 参数规模实现了高性能与低门槛的完美结合,旨在满足当前日益增长的 AI 图像生成需求。随着行业对图像生成技术的期待日益高涨,LongCat-Image 模型应运而生,填补了开源与闭源模型之间的差距。

QQ20251208-101231.png

LongCat-Image 在文生图和图像编辑领域的表现十分出色。在图像编辑方面,模型在多个基准测试中达到了开源 SOTA(State-of-the-Art)水平,充分证明了其在指令遵循和视觉一致性方面的强大能力。团队通过系统性的训练策略与数据工程,使得模型在多样化的指令下,仍能保持高效的性能和准确性。

特别是在中文文字生成方面,LongCat-Image 展现出极高的精准度。模型采用课程学习策略,针对汉字的字符覆盖和渲染效果进行了全面提升,能够支持复杂笔画结构汉字的渲染,满足海报设计、商业广告等场景的需求。

QQ20251208-101339.png

此外,LongCat-Image 的设计注重用户体验,采用主观评分方法对模型进行评估,确保在文生图和图像编辑任务中的真实度与视觉合理性均达到高水平。这一切的努力使 LongCat-Image 在与其他开源和闭源模型的竞争中脱颖而出,展现出强大的市场潜力。

LongCat 团队表示,他们希望通过开源的方式构建一个透明、开放、协作的生态系统,鼓励开发者参与到模型的使用与共建中。用户可以通过 Hugging Face 和 GitHub 访问 LongCat-Image,体验这一高效能模型的强大功能。

为了进一步拓宽 AI 创作的可能性,LongCat APP 也进行了升级,新增图生图功能,用户可轻松上传各种素材,模型将自动生成全新图像。同时,APP 提供了24个易用模板,帮助用户快速实现专业级图像创作。

地址: https://longcat.ai/