中國人工智能領域的領軍企業智譜AI(Zhipu AI)再次掀起行業熱潮。AIbase最新獲悉,智譜AI於近日正式開源其新一代通用視覺模型GLM-4.1V-Thinking。這款9億參數的多模態推理模型憑藉卓越的性能和廣泛的應用場景,不僅在多項權威評測中刷新紀錄,還展現了比肩甚至超越72億參數模型的強大實力。以下是AIbase整理的最新資訊,帶您深入瞭解這一突破性技術。

image.png

引入思維鏈推理,性能大幅提升

GLM-4.1V-Thinking基於智譜AI此前的GLM-4V架構進行了深度優化,引入了創新的思維鏈推理機制(Chain-of-Thought Reasoning)。這一機制顯著增強了模型在複雜認知任務中的表現,使其能夠更高效地處理多模態輸入,包括圖像、視頻和文檔等。據AIbase瞭解,該模型在28項權威評測(如MMStar、MMMU-Pro、ChartQAPro、OSWorld等)中,23項達到了10億參數級別模型的最高成績,其中18項表現持平或超越了參數規模更大的Qwen-2.5-VL72B模型,展現了其驚豔的推理能力。

多模態能力全面覆蓋,賦能千行百業

GLM-4.1V-Thinking支持高達64K的上下文長度和4K圖像分辨率,同時具備中英文雙語能力,能夠無縫處理多語言場景下的複雜任務。無論是長視頻理解、圖像問答、學科解題、文字識別、文檔解讀,還是圖像定位(Grounding)、GUI代理操作以及代碼生成,這款模型都能遊刃有餘。其開源特性進一步降低了使用門檻,單張3090顯卡即可運行,免費商用授權更是爲企業和開發者提供了廣闊的應用空間。AIbase認爲,這一靈活性和高性能的結合將極大推動AI技術在教育、金融、醫療等行業的落地應用。

開源戰略,引領全球AI競爭

智譜AI此次選擇將GLM-4.1V-Thinking完全開源,並通過Hugging Face平臺提供模型權重和演示,彰顯了其推動AI技術普及的決心。AIbase注意到,智譜AI近年來在開源領域動作頻頻,其GLM系列模型已累計全球下載超3000萬次,成爲中國AI生態的重要組成部分。此次開源的GLM-4.1V-Thinking不僅爲開發者提供了高性能的多模態推理工具,還通過MIT許可證確保了其商業應用的靈活性,進一步鞏固了智譜AI在全球AI領域的競爭力。

與全球頂尖模型正面交鋒

在性能對比中,GLM-4.1V-Thinking展現了令人矚目的實力。AIbase綜合評測數據發現,該模型在多項複雜任務中表現出色,尤其是在STEM學科問題和長文檔理解等高難度場景中,部分性能甚至超過了OpenAI的GPT-4o模型。這種跨越式的進步表明,智譜AI在多模態推理領域已躋身全球領先行列,與OpenAI、Google等國際巨頭展開正面競爭。

中國AI的崛起新篇章

作爲中國AI領域的“新四虎”之一,智譜AI通過持續的技術創新和開放的生態戰略,正在重塑全球AI格局。AIbase認爲,GLM-4.1V-Thinking的發佈不僅是智譜AI技術實力的體現,更是中國AI產業在全球舞臺上的一次重要發聲。未來,隨着更多開發者基於GLM-4.1V-Thinking構建創新應用,中國AI的國際影響力將進一步擴大。

結語

智譜AI的GLM-4.1V-Thinking以其強大的多模態推理能力和開源特性,爲全球AI社區帶來了新的可能性。AIbase將持續關注智譜AI的最新動態,爲您帶來更多前沿科技報道。讓我們共同期待這款模型如何在千行百業中掀起變革!