4月2日,

核心突破:看得懂畫面,寫得出代碼
作爲原生多模態 Coding 基座,
多維感知: 原生理解圖片、視頻、設計稿及複雜的文檔版面,支持畫框、截圖、讀網頁等多種視覺工具調用。
超長視野: 上下文窗口擴展至 200k,能夠輕鬆處理龐大的工程項目或長篇技術文檔。
性能領先: 在多模態 Coding、GUI Agent(圖形用戶界面智能體)等核心基準測試中,該模型以更小的尺寸取得了超越同類產品的表現。

典型場景:從“草圖”到“成品”的秒級跨越
前端復刻: 只需發送一張設計稿截圖或一段操作錄屏,模型即可理解佈局、配色與交互邏輯,生成可直接運行的前端工程。
GUI 自主探索: 結合 Claude Code 等框架,它能像真人一樣自主瀏覽網頁、梳理跳轉關係並採集素材,實現全站級別的視覺復現。
交互式編輯: 支持通過對話直接增刪模塊、修改樣式或調整佈局,實現可視化的代碼迭代。
賦能“龍蝦”:AutoClaw 迎來視覺進化
在智譜自研的智能體
行業觀察:編程不再是“盲人摸象”
隨着
