正文

Hugging Face推出aMUSEd模型，几秒钟内生成图像

aibase

发布于AI新闻资讯

发布时间 :2024年1月5号 10:29

阅读 :1分钟

Hugging Face推出的aMUSEd模型可以在几秒钟内生成图像，采用了轻量级的文本到图像模型，使用Masked Image Model（MIM）架构，大大减少了推理步骤，提高了生成速度和可解释性。aMUSEd模型可在Hugging Face上的演示中进行尝试，目前以研究预览版形式提供，使用OpenRAIL许可证，鼓励社区进一步探索非扩散框架用于图像生成。

相关推荐

阿里发布Qwen-Image-3.0，支持4.5K Token超长输入与复杂图文生成

阿里发布Qwen-Image-3.0图像生成基础模型，支持最长4.5K Token文本输入，可一次性生成公式、几何图形、逻辑推导及多层UI等复杂内容，原生兼容12种语言和20余款字体渲染，文本长度较上代提升4.5倍，大幅强化影视分镜、知识图解等商业级图文创作能力。

2026年7月21号 15:16

图像生成再提速：谷歌发布 Nano Banana 2 Lite 模型，极致性价比挑战行业门槛

谷歌推出新AI模型Nano Banana2Lite，在激烈竞争中凸显速度与成本优势。其核心升级在于将单图生成时间压缩至4秒内，大幅降低延迟，同时优化使用成本。

2026年7月1号 10:48

xAI 发布 Grok Imagine 质量模式 API：视觉生成迈入写实新纪元

xAI 推出 Grok Imagine API 的“质量模式”，面向开发者与企业。该模式在视觉写实、文字渲染和创意控制三大核心维度实现突破，能生成细节丰富、自然逼真的图像，显著提升画面细腻度与表现力。

2026年5月7号 10:57

告别 AI 标准脸：阿里发布 Wan2.7-Image，开启“千人千面”新时代

阿里发布Wan2.7-Image模型，在人像定制、色彩控制和长文本渲染方面实现突破，旨在解决AI生成图像“千篇一律”的问题。模型已上线阿里云百炼平台API并开放体验，核心升级包括虚拟“捏脸”和精准调色盘功能，显著提升创作自由度。

2026年4月1号 15:53

Midjourney V8开启测试:生成速度提升5倍并支持原生2K渲染

Midjourney V8模型发布，图像生成速度提升5倍，支持2K分辨率，新增增强图像连贯性参数，提升对复杂文本指令的遵循能力，优化图像内嵌文本渲染准确率。

2026年3月19号 11:20

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2026AIBase