近日,智譜AI與華爲聯合宣佈開源新一代圖像生成大模型 GLM-Image,該模型不僅在性能上達到當前國際領先水平(SOTA),更創下一項關鍵紀錄:全球首個從數據處理、訓練到推理全流程均基於國產AI芯片完成的多模態大模型。

據悉,GLM-Image全程依託華爲昇騰Atlas800T A2服務器與昇思MindSpore AI框架構建,徹底擺脫對國外GPU及深度學習框架的依賴,驗證了國產軟硬件棧支撐尖端AI研發的可行性與成熟度。

image.png

技術層面,GLM-Image採用智譜自主研發的 “自迴歸+擴散解碼器”混合架構,巧妙融合語言建模的邏輯連貫性與擴散模型的高保真生成能力。這一設計使其不僅能根據文本精準生成高質量圖像,還能實現圖文語義的深度對齊與聯合推理,爲“認知型生成”(Cognitive Generation)這一新興範式提供核心引擎。該技術路線正被應用於以Nano Banana Pro爲代表的下一代AI創作平臺,推動AIGC從“像素堆砌”邁向“語義驅動”。

此次合作標誌着國產AI生態正從“可用”走向“好用”。過去,高性能多模態模型幾乎全部依賴英偉達GPU與PyTorch/TensorFlow生態;如今,GLM-Image的成功訓練證明,基於昇騰+MindSpore的全棧國產方案已具備支撐前沿科研與產業落地的能力。

在中美科技競爭加劇、算力自主可控成爲國家戰略的背景下,GLM-Image的發佈不僅是一次技術成果展示,更是中國AI產業鏈協同創新的關鍵一步。隨着更多開發者基於該模型進行微調與應用開發,一個真正自主、開放、高性能的中文多模態生態有望加速成型。

項目地址:https://github.com/zai-org/GLM-Image