智譜發佈全新視覺大模型 GLM-4.5V，能輕鬆區分炸雞品牌！

8月11日，智譜科技正式推出其最新的視覺理解模型 ——GLM-4.5V。這款模型是基於其新一代文本模型 GLM-4.5-Air 進行訓練的，繼承了上一代視覺推理模型 GLM-4.1V-Thinking 的技術路線，擁有驚人的1060億參數和120億激活參數。值得一提的是，GLM-4.5V 還新增了 “思考模式” 開關功能，用戶可以選擇是否啓用該模式，從而在處理任務時更靈活。

這一模型的視覺能力令人矚目，能夠輕鬆分辨出麥當勞和肯德基的炸雞翅，從外觀色澤和質感等多個角度進行深入分析。此外，GLM-4.5V 還能參與圖像猜地點的挑戰，甚至在比賽中取得了優異的成績，超越了99% 的人類參賽者，位列第66名。智譜還展示了該模型在42個基準測試中的卓越表現，在絕大多數測試中得分超過同等規模的其他模型。

目前，GLM-4.5V 已經在開源平臺如 Hugging Face、魔搭和 GitHub 上線，用戶可以免費下載使用，並且還提供了 FP8量化版本。爲了更好地體驗這一模型，智譜推出了一個桌面助手應用程序，支持實時截屏和錄屏，幫助用戶完成各種視覺推理任務，包括代碼輔助和文檔解讀。

在實際測試中，GLM-4.5V 展現了出色的能力，能夠根據上傳的圖片進行位置推斷，雖然偶爾會出現小誤差，但推理過程仍然非常豐富。而在處理網頁內容時，它可以通過截圖生成相似度高的頁面，展現出強大的復現能力。

GLM-4.5V 不僅在視覺理解領域表現突出，還在 Agent 應用場景中展現出巨大潛力。隨着這一技術的不斷髮展，我們有理由期待它在未來的應用中爲人們的生活帶來更多便捷。

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://top.aibase.com/1、智譜GLM-4.5V開源發佈:全球100B級最佳視覺推理模型智譜宣佈推出並開源了全球100B級效果最佳的開源視覺推理模型GLM-4.5V，這是該公司在通向通用人工智能（AGI）道路上的又一重要探索性成果。【AiBase提要:】🤖 GLM-4.5V總參數達到106B，在41個視覺多模態榜單中達到SOTA性能🎯 具備全場景視覺推理能

智譜視覺推理模型GLM-4.5V上線並開源

智譜宣佈推出並開源了全球100B級效果最佳的開源視覺推理模型GLM-4.5V，這是該公司在通向通用人工智能（AGI）道路上的又一重要探索性成果。該模型在魔搭社區與Hugging Face上同步開源，其總參數達到106B，激活參數爲12B，標誌着多模態推理技術的新里程碑。 GLM-4.5V基於智譜新一代旗艦文本基座模型GLM-4.5-Air，延續了GLM-4.1V-Thinking的技術路線。在41個公開視覺多模態榜單中，GLM-4.5V的綜合效果達到了同級別開源模型的最高性能（SOTA），涵蓋了圖像、視頻、文檔理解以及GUI Agent等常見任務。該模型不僅在多模態榜單上表現出色，更在真實場景下的表現與可用性方面得到了重視。

智譜管理層大變動，前 Midjourney 高管王玥婷加盟

近日，智譜科技（Aibot）經歷了一次顯著的管理層變動。前 Midjourney 亞洲區副總裁王玥婷正式加入智譜，負責多模態產品和市場的發展。此次人事變動引發了業界的廣泛關注，尤其是在數字化和人工智能快速發展的背景下，智譜選擇引進具有豐富行業經驗的人才，意在增強其市場競爭力。智譜的首席戰略官張闊和副總裁曲滕相繼離職，這一消息雖然引起了一些猜測，但公司內部人士表示，這並不會對公司的融資計劃造成影響。智譜正在積極尋求新的投資機會，計劃吸引年輕的中高層管理人

豆包大模型家族全面升級，重磅推出視覺理解模型、音樂4.0模型

在2024年12月18日的火山引擎 FORCE 原動力大會上，火山引擎宣佈對豆包大模型家族進行全面升級，並重磅發佈了全新的視覺理解模型。火山引擎總裁譚待表示，豆包大模型的日均 tokens 使用量在過去幾個月中迅猛增長，達到了超過4萬億，相較於5月發佈時增長了33倍。這一增長趨勢顯示出豆包大模型在多個應用場景中的廣泛使用。本次，火山引擎通過推出視覺理解模型，使得用戶能夠同時輸入文本和圖像的問題，模型能夠綜合理解並給出準確的回答。這一創新將大大簡化應用的開發流程，並激

智譜發佈全新視覺大模型 GLM-4.5V，能輕鬆區分炸雞品牌！

相關推薦

百度推出 Qianfan-VL 模型多尺寸模型滿足不同場景需求

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

智譜視覺推理模型GLM-4.5V上線並開源

智譜管理層大變動，前 Midjourney 高管王玥婷加盟

豆包大模型家族全面升級，重磅推出視覺理解模型、音樂4.0模型

智譜發佈全新視覺大模型 GLM-4.5V，能輕鬆區分炸雞品牌！

相關推薦

百度推出 Qianfan-VL 模型 多尺寸模型滿足不同場景需求

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

​智譜視覺推理模型GLM-4.5V上線並開源

智譜管理層大變動，前 Midjourney 高管王玥婷加盟

​豆包大模型家族全面升級，重磅推出視覺理解模型、音樂4.0模型

百度推出 Qianfan-VL 模型多尺寸模型滿足不同場景需求

智譜視覺推理模型GLM-4.5V上線並開源

豆包大模型家族全面升級，重磅推出視覺理解模型、音樂4.0模型