作为一款专为智能体场景设计的模型,Step3.5Flash采用稀疏MoE架构,其总参数量达1960亿,通过优化仅在推理时激活约110亿参数,实现了极高的能效比。在单请求代码任务中,其推理速度最高可达350TPS。凭借出色的复杂推理能力与长链任务处理水平,该模型在推理深度上已具备挑战顶级闭源模型的实力。

目前,Step3.5Flash在开源社区表现活跃,其在Hugging Face的下载量已突破30万次,并登顶OpenRouter Trending榜首。在被誉为“小龙虾”的知名开源项目OpenClaw中,该模型凭借其在速度、稳定性及Agent适配性方面的显著优势,调用量已跃升至全球前二。
此次全链路开源不仅丰富了开源大模型的生态多样性,也为开发者构建高性能Agent提供了更为灵活、透明的底层支撑,标志着国产大模型在平衡模型性能与推理成本方面取得了重要突破。
