階躍星辰(Stepfun)近日正式發佈了其最新一代開源基座模型——Step3.5Flash。該模型專爲智能體(Agent)場景打造,憑藉強大的推理能力與極致的響應速度,旨在爲開發者提供一個更聰明、更穩定且成本可控的“Agent 大腦”。

作爲一款針對性極強的輕量化模型,Step3.5Flash 在多個維度實現了突破:
極致速度:推理速度最高可達350TPS(每秒生成的詞數),尤其在代碼類任務中表現卓越。
性能比肩閉源:在 Agent 核心應用場景和數學邏輯任務上,其表現足以媲美主流閉源大模型。
長鏈條任務保障:具備處理複雜、長邏輯鏈條任務的穩定性,能夠高效應對256K 的超長上下文。
技術架構:兼顧效率與深度
Step3.5Flash 採用了先進的稀疏 MoE(混合專家)架構,總參數量達到1960億,但每個 Token 激活的參數量僅約爲110億。 爲了進一步提升效率,模型引入了 MTP-3 技術,實現一次預測3個 Token,效率直接翻倍。 此外,通過滑動窗口與全局注意力的混合架構,模型能夠精準捕捉長文本中的“重點”,大幅降低了計算開銷。
多場景實測:從代碼到端雲協同
在實際應用演示中,Step3.5Flash 展現了多樣化的才華:
智能編程:僅憑一段文字描述,即可自動編寫並輸出基於 WebGL2.0引擎的高性能可視化平臺。
複雜計算:在不使用外部工具的情況下,能夠快速完成等差數列求和、階乘累加等高難度數學運算。
端雲協同:作爲“雲端大腦”,它能將用戶模糊的需求(如對比各平臺價格)拆解爲具體的搜索與抓取子任務,極大地簡化了本地執行端的難度,確保結果的可靠性。
目前,Step3.5Flash 已在主流平臺全量上線,包括 GitHub、HuggingFace 以及 OpenRouter。 爲了降低本地部署門檻,階躍星辰專門優化了模型在個人工作站(如 NVIDIA DGX、Apple M4Max 等)上的運行性能。 此外,公司宣佈已經啓動 Step4 模型的訓練,並邀請全球開發者共同定義下一代 Agent 基礎模型。
OpenRouter 限免中,0成本升級你的 Agent:https://openrouter.ai/stepfun/step-3.5-flash
GitHub 下載快速部署,打造專屬 Agent:https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
HuggingFace 獲取模型權重:https://huggingface.co/stepfun-ai/Step-3.5-Flash
