智譜發佈 GLM-5V-Turbo 多模態 Coding 大模型

4月2日，智譜正式發佈了專爲視覺編程打造的多模態基座模型 GLM-5V-Turbo。這款模型不僅能寫代碼，更擁有了“看懂”世界的能力，旨在將 AI Agent 的感知鏈路從枯燥的字符延伸到豐富的設計稿與網頁界面中。

核心突破:看得懂畫面，寫得出代碼

作爲原生多模態 Coding 基座，GLM-5V-Turbo 實現了視覺與編程能力的深度融合:

典型場景:從“草圖”到“成品”的秒級跨越

GLM-5V-Turbo 的加入，讓開發者可以體驗到前所未有的工作流:

賦能“龍蝦”:AutoClaw 迎來視覺進化

在智譜自研的智能體 AutoClaw（龍蝦） 中接入該模型後，原本只能處理文字任務的“龍蝦”具備了真正的視覺能力。例如，它現在能直接看懂 K 線走勢圖、解讀券商研報中的複雜圖表，並在60秒內完成多路數據採集，輸出圖文並茂的專業分析報告。

行業觀察:編程不再是“盲人摸象”

隨着 GLM-5V-Turbo 的發佈，智譜成功將 AI 的理解力從單純的語法邏輯推向了美學與感知邏輯。當 AI 能夠“看見”屏幕並理解人類的操作環境時，真正的全自動編程輔助（Agentic Coding）纔算真正拉開了序幕。

智譜發佈 GLM-5V-Turbo：給 AI 智能體安上“火眼金睛”