智譜AI開源端側大語言和多模態模型GLM-Edge系列

智譜科技近日宣佈開源其端側大語言和多模態模型GLM-Edge系列，這一舉措標誌着公司在端側真實落地使用場景中的一次重要嘗試。GLM-Edge系列由四種不同尺寸的模型組成，包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B，分別針對手機、車機等移動平臺以及PC等桌面平臺進行了優化。

智譜 AI

基於GLM-4系列的技術積累，智譜的研究團隊對模型結構和尺寸進行了調整，以實現模型性能、實機推理效果和落地便利度之間的最佳平衡。通過與合作伙伴的深入合作和推理優化，GLM-Edge系列模型在一些端側平臺上展現出了卓越的運行速度。特別是在高通驍龍8Elite平臺上，藉助NPU算力和混合量化方案，1.5B對話模型和2B多模態模型能夠實現每秒60tokens以上的解碼速度，應用投機採樣技術後，解碼速度更是能達到每秒100tokens以上。

智譜開源的GLM-Edge系列模型不僅展示了公司在人工智能領域的技術實力，也爲開發者和研究者提供了強大的工具和資源，以促進端側AI應用的發展和創新。

GLM-Edge合集:

https://modelscope.cn/collections/GLM-Edge-ff0306563d2844

高通與字節跳動達成 AI 芯片供應協議，共同發力 AI 智能體基礎設施

高通與字節跳動於5月26日簽署AI芯片供應合作協議。高通將爲字節跳動提供數百萬顆定製化ASIC芯片，用於支持數據中心AI工作負載及智能體軟件基礎設施。此次合作不僅是商業採購，更涉及大規模芯片供應與生產製造的深度綁定。

智譜AI開源端側大語言和多模態模型GLM-Edge系列

相關推薦

智能眼鏡成首批受益者！高通推出全新個人 AI 設備上市加速計劃

溢價數倍勢在必得，高通正洽談最高百億美元收購 AI 芯片初創公司

擺脫屏幕束縛！微軟發佈 Project Solara 平臺，攜手高通聯發科打造企業 AI 智能體終端

顛覆傳統操作系統！微軟聯合高通發佈Solara項目，開啓AI智能體新時代

高通與字節跳動達成 AI 芯片供應協議，共同發力 AI 智能體基礎設施