今日,Step3.7Flash 正式亮相,這款開源模型直指 Agent 時代核心痛點——效率、可靠性和多模態執行能力,以開放權重(Apache2.0協議)的方式迅速引發業界關注。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

基準測試領跑,實戰能力突出

Step3.7Flash 在多項關鍵評測中取得亮眼成績:

  • ClawEval-1.1排名第一(67.1分)
  • SimpleVQA Search 排名第一(79.2分)
  • SWE-PRO 排名第二(56.3分)
  • V* Python 得分高達95.3

這些成績顯示其在 Agent 任務、代碼生成、視覺搜索等複雜場景中具備領先競爭力。

核心參數:速度、成本與能力的均衡之作

作爲一款專爲 Agentic、代碼、搜索和多模態工作流設計的模型,Step3.7Flash 在速度與效能上實現顯著突破:

  • 推理速度:達到400TPS
  • 架構:198B 稀疏 MoE 結構,活躍參數約11B
  • 上下文長度:支持256K
  • 推理層級:提供3種推理級別

在保持高性能的同時,顯著降低了實際部署成本,爲開發者提供了高效選擇。

多模態理解 + 可靠執行,真正“看見就能做”

Step3.7Flash 的最大亮點在於其強大的感知 - 行動閉環能力。它能夠理解 UI 界面、圖表、文檔和圖像等視覺內容,並據此自主編寫代碼或調用工具完成操作。

其增強的 Web+ 視覺搜索功能可觸達更多信息源,並支持深度跟進查詢。同時,工具調用可靠性大幅提升,在τ²-bench 全難度級別上達到98%+ 成功率,有效減少了常見的目標漂移和工具調用失敗問題。

生態兼容與本地部署友好

模型已與 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 等協議實現良好兼容。同時,它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395等硬件上本地運行,爲本地化部署和隱私敏感場景提供了便利。

AIbase 點評:Step3.7Flash 的發佈,標誌着開源 Agent 模型從“能用”向“好用、可靠、高效”邁出了重要一步。在 Agent 成爲 AI 核心應用形態的當下,這類平衡了速度、成本與執行可靠性的模型,或將成爲開發者構建下一代智能工作流的重要基石。

項目地址:https://github.com/stepfun-ai/Step-3.7-Flash