Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來

今日，Step3.7Flash 正式亮相，這款開源模型直指 Agent 時代核心痛點——效率、可靠性和多模態執行能力，以開放權重（Apache2.0協議）的方式迅速引發業界關注。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

基準測試領跑，實戰能力突出

Step3.7Flash 在多項關鍵評測中取得亮眼成績:

ClawEval-1.1排名第一（67.1分）
SimpleVQA Search 排名第一（79.2分）
SWE-PRO 排名第二（56.3分）
V* Python 得分高達95.3

這些成績顯示其在 Agent 任務、代碼生成、視覺搜索等複雜場景中具備領先競爭力。

核心參數:速度、成本與能力的均衡之作

作爲一款專爲 Agentic、代碼、搜索和多模態工作流設計的模型，Step3.7Flash 在速度與效能上實現顯著突破:

推理速度:達到400TPS
架構:198B 稀疏 MoE 結構，活躍參數約11B
上下文長度:支持256K
推理層級:提供3種推理級別

在保持高性能的同時，顯著降低了實際部署成本，爲開發者提供了高效選擇。

多模態理解 + 可靠執行，真正“看見就能做”

Step3.7Flash 的最大亮點在於其強大的感知 - 行動閉環能力。它能夠理解 UI 界面、圖表、文檔和圖像等視覺內容，並據此自主編寫代碼或調用工具完成操作。

其增強的 Web+ 視覺搜索功能可觸達更多信息源，並支持深度跟進查詢。同時，工具調用可靠性大幅提升，在τ²-bench 全難度級別上達到98%+ 成功率，有效減少了常見的目標漂移和工具調用失敗問題。

生態兼容與本地部署友好

模型已與 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 等協議實現良好兼容。同時，它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395等硬件上本地運行，爲本地化部署和隱私敏感場景提供了便利。

AIbase 點評:Step3.7Flash 的發佈，標誌着開源 Agent 模型從“能用”向“好用、可靠、高效”邁出了重要一步。在 Agent 成爲 AI 核心應用形態的當下，這類平衡了速度、成本與執行可靠性的模型，或將成爲開發者構建下一代智能工作流的重要基石。

項目地址：https://github.com/stepfun-ai/Step-3.7-Flash

節省 40 億元還是觸發監管？微軟擬爲Copilot引入國產AI模型陷兩難

微軟正評估將月之暗面開發的Kimi K3開源模型引入Copilot服務，以大幅降低AI運營成本。作爲全球參數規模最大的開源模型，Kimi K3在編程等多項評測中性能媲美頂尖模型，有望替代此前主要依賴的OpenAI與Anthropic技術，重塑底層架構。微軟內部測算顯示，此舉每年最高可節省6億美元。

Hugging Face披露AI智能體攻擊事件，採用GLM5.2完成日誌取證分析

Hugging Face遭黑客AI攻擊後，先用美國商業大模型API分析1.7萬條日誌，卻因無法區分攻防人員遭安全機制誤判拒阻；隨後轉向自身基礎設施部署中國開源模型GLM5.2，成功完成海量日誌取證。事件突顯不同AI模型在安全場景下的表現差異。

前OpenAI CTO穆拉蒂打造多模態Inkling模型登場，號稱美國最強開源AI

前OpenAI CTO穆拉蒂創立的思維機器實驗室發佈首款從零訓練多模態模型Inkling，號稱美國最強開源。採用MoE（975B總參/41B激活），上下文100萬token，預訓練45萬億token覆蓋圖文音視頻，已開源權重。團隊豪華，但推理編程不及中國開源勁旅。

Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來

基準測試領跑，實戰能力突出

核心參數:速度、成本與能力的均衡之作

多模態理解 + 可靠執行，真正“看見就能做”

生態兼容與本地部署友好

相關推薦

節省 40 億元還是觸發監管？微軟擬爲Copilot引入國產AI模型陷兩難

Hugging Face披露AI智能體攻擊事件，採用GLM5.2完成日誌取證分析

楊植麟在GTC2026 攤牌：月之暗面把Adam、全注意力和殘差連接全換了，而且全部開源

2. 8 萬億參數、 100 萬詞元上下文，Kimi K3 把開源大模型的天花板頂到了全球最高

前OpenAI CTO穆拉蒂打造多模態Inkling模型登場，號稱美國最強開源AI

​Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來

基準測試領跑，實戰能力突出

核心參數:速度、成本與能力的均衡之作

多模態理解 + 可靠執行，真正“看見就能做”

生態兼容與本地部署友好

相關推薦

節省 40 億元還是觸發監管？微軟擬爲Copilot引入國產AI模型陷兩難

Hugging Face披露AI智能體攻擊事件，採用GLM5.2完成日誌取證分析

楊植麟在GTC2026 攤牌：月之暗面把Adam、全注意力和殘差連接全換了，而且全部開源

2. 8 萬億參數、 100 萬詞元上下文，Kimi K3 把開源大模型的天花板頂到了全球最高

前OpenAI CTO穆拉蒂打造多模態Inkling模型登場，號稱美國最強開源AI

Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來