继去年9月发布4.0版本后,字节跳动 Seed 团队于今日(2026年2月13日)正式推出 Seedream5.0Lite 智能图像创作模型。这款新模型不再仅仅追求像素级的堆砌,而是通过“多模态统一架构”实现了从单纯执行指令到深度理解意图的跨越,被定位为更聪明、更专业的“视觉创意伙伴”。

核心技术突破:懂逻辑、知世界
Seedream5.0Lite 的核心提升集中在“思考”深度上。其显著特征包括:
多步视觉推理: 模型能够理解物理规律。例如,它可以根据围棋残局推理出下一步落子并生成后续棋局,或根据零散零件图推理出物体类型并完成合理组装。
实时检索增强(RAG): 首次引入联网能力,模型可实时获取天气、金价、票房等最新资讯,精准生成具有时效性的资讯海报或趋势图表。
深厚的世界知识: 内置覆盖科技、人文等多领域的知识库,使其在生成石油地质剖面、热带雨林层次等专业信息图谱时,具有极高的准确性。
创作体验升级:从“画图”到“协作”
在实际应用中,Seedream5.0Lite 展现了极强的专业协作能力:
高阶图片编辑: 支持模糊指令。用户只需给出简单描述或参考图对比,模型即可精准推测意图,实现局部重绘、光影修改或焦点调整,同时保持非编辑区域的一致性。
精准风格迁移: 无需复杂提示词,通过“通感”参考图,即可瞬间捕捉并迁移复杂的艺术神韵与光影。
复杂多主体控制: 在3x3展示架或5人同框等复杂场景中,能精准还原每个主体的属性(如颜色、数字、特定动作),大幅减少“幻觉”与遗漏。

左图 Prompt:一张丰富多彩的自然生态图,展示热带雨林的四个垂直层次(露生层、树冠层、灌木层、地表层)。
中图 Prompt:一张英文石油系统信息图表,显示石油钻井平台和地质层。
右图 Prompt:高中数学教材插图,可视化函数在某一点的导数的几何意义,白色背景,线条清晰,科学专业准确。
评测表现与落地
在 MagicArena 竞技平台的双盲对战中,Seedream5.0Lite 的 Elo 评分显著超越4.5版本,尤其在办公学习、知识推理和人像增强场景下进步巨大。目前,该模型已上线 即梦AI、火山方舟体验中心,并在 豆包 开启内测。
字节跳动表示,未来将继续 Scaling 模型以提升智能上限,并支持更多轮次的交互式编辑,助力图像生成从“创意玩具”真正走向“生产力工具”。
