智譜推出 GLM-5V-Turbo：爲 AI 編程安上“眼睛”，設計稿秒變代碼

智譜 AI 近日發佈了專門針對視覺編程打造的大模型 GLM-5V-Turbo。這款模型最大的突破在於它不僅能理解文字，還能直接“看懂”設計稿和網頁截圖。

通過原生多模態能力的融合，GLM-5V-Turbo 讓 AI 編程告別了純文本輸入的侷限。開發者只需上傳一張草圖或界面截圖，模型就能自動生成可運行的前端代碼。

視覺感知:從“讀文檔”到“看界面”

這款新模型擁有200k 的超長上下文窗口，能夠處理極其複雜的代碼庫。它不僅能識別網頁的佈局，還能精準捕捉配色、組件層級以及細微的交互邏輯。

在實際測試中，GLM-5V-Turbo 在設計稿還原和視覺代碼生成等任務上表現出色。這意味着從視覺稿到成品頁面的轉化效率將得到質的飛躍。

賦能智能體:讓“龍蝦”具備觀察力

智譜旗下的 AutoClaw（龍蝦）智能體在接入該模型後，獲得了真正的視覺能力。它現在可以像人類一樣瀏覽網頁，甚至能解讀複雜的 K 線圖和券商研報圖表。

目前，龍蝦已上線“股票分析師”功能，支持四路數據源並行採集。它能在60秒內看懂市場走勢並輸出圖文並茂的專業報告，極大拓寬了 AI 助手的任務邊界。

智譜此舉標誌着 AI Agent 的感知鏈路正式從純文本延伸到了視覺交互領域。當 AI 具備了“所見即所得”的能力，軟件開發的門檻將進一步降低。

對於前端開發者而言，交互式編輯功能將成爲強大的催化劑。用戶可以通過簡單的指令要求 AI 修改樣式或增加彈窗，實現可視化、高效率的迭代開發。

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

NVIDIA推出Nemotron3Embed嵌入向量模型系列，專爲生產級RAG、智能體檢索、代碼檢索和記憶場景設計。8B版本在RTEB基準測試中排名第一，成爲性能最強的開源嵌入模型。系列包含三個開放檢查點：精度優先的Nemotron-3-Embed-8B-BF16、輕量化的1B-BF16版，以及針對Blackwell架構優化的1B-NVFP4四比特版本，所有模型均採用雙向注意力機制。

智譜推出 GLM-5V-Turbo：爲 AI 編程安上“眼睛”，設計稿秒變代碼

視覺感知:從“讀文檔”到“看界面”

賦能智能體:讓“龍蝦”具備觀察力

相關推薦

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

銀河通用機器人創始人王鶴： 2028 年，具身智能的 “ChatGPT 時刻” 即將來臨！

超低延遲 AI 對話神器！Wan-Streamer v0.2 讓你與 AI 零距離溝通

文遠知行推出物理 AI 大模型 WITT

百度沈抖：每位員工每月發 1000 元額度自由體驗主流大模型，強制推行AI辦公難見效