智譜CogView3-Plus模型開源文生圖技術迎來新紀元

智譜技術團隊今日發佈了一則振奮人心的消息，他們最新研發的文生圖模型CogView3及其升級版CogView3-Plus-3B已正式開源，同時在"智譜清言"App中成功上線。這兩款模型的問世，標誌着AI輔助藝術創作邁入了一個新的階段。

CogView3作爲一款基於級聯擴散的文本轉圖像模型，其生成過程堪稱精妙。模型首先生成一幅512x512像素的低分辨率圖像，隨後通過中繼擴散過程將其提升至1024x1024，最終再次迭代，呈現出一幅2048x2048的高清大圖。這種層層遞進的生成方式，猶如數字畫家在畫布上逐步完善作品，爲用戶帶來了極致的視覺體驗。

據官方評估，CogView3的表現令人驚歎，其性能竟比當前頂尖的開源文生圖模型SDXL高出77%。更值得一提的是，CogView3的推理速度僅爲SDXL的十分之一，充分展現了智譜團隊在模型優化方面的卓越成就。

CogView3-Plus的推出更是將這一技術推向了新的高峯。該版本引入了先進的DiT框架，採用了Zero-SNR擴散噪聲調度，並創新性地加入了文本-圖像聯合注意力機制。這些改進不僅提升了模型的整體性能，還大幅降低了訓練和推理成本，實現了效能與效率的完美平衡。CogView3-Plus採用的16維VAE潛在空間，爲未來圖像生成技術的發展開闢了新的可能性。

對於渴望探索這一前沿技術的開發者和研究者，智譜技術團隊已經開放了CogView3和CogView3-Plus-3B的源代碼倉庫。這一舉措無疑將推動整個AI圖像生成領域的快速發展，爲更多創新應用提供堅實的技術基礎。

隨着CogView3系列模型的問世，文生圖技術的應用前景更加廣闊。從個人創作到商業設計，從教育輔助到娛樂產業，這項技術都有望帶來革命性的變革。我們可以預見，在不久的將來，AI輔助創作將成爲常態，讓更多人能夠輕鬆實現自己的藝術構想。

開源倉庫地址:

https://top.aibase.com/tool/cogview3

Plus 開源模型倉庫:

https://top.aibase.com/tool/cogview3-plus-3b

AI創業老兵胡云華加入智譜，擔任C端應用“智譜清言”負責人

據智能涌現消息，近日，前微軟亞洲研究院研究員、阿里達摩院資深技術專家、支付寶中國首席數據官胡云華加入大模型獨角獸智譜，擔任C端應用“智譜清言”負責人。胡云華的加入，標誌着智譜在產品負責人方面的新篇章。據悉，胡云華的背景非常豐富。他在2003年進入微軟亞洲研究院實習，並在2007年正式成爲研究員。2012年，他又加入了阿里達摩院，花名爲“吳鉤”。在阿里的兩年裏，他負責構建了購物意圖挖掘、匹配優化等推薦算法的搭建，是阿里媽媽推薦算法團隊最具代表性的人才

智譜清言瀏覽器插件接入AutoGLM 可模擬人類自動完成網頁任務

智譜清言瀏覽器插件近日宣佈接入AutoGLM能力，標誌着瀏覽器插件向智能Agent的進化。現在，通過AutoGLM的集成，清言插件能夠根據用戶的文字或語音指令，模擬人類操作自動完成網頁任務，爲用戶提供“全自動”的上網新體驗AutoGLM是智譜推出的一款大模型智能交互智能體（Agent），它能夠理解用戶意圖並執行相應的操作。目前，這項能力已在百度搜索、微博、知乎、Github和Arxiv等數十個網站上實現，允許用戶執行復雜的搜索和篩選任務，以及對多個鏈接內容進行總結。

智譜AI推出AutoGLM智能體：輸入指令即可模擬人類操作手機

智譜技術團隊最近推出了一個基於GLM技術團隊研究成果的新產品——AutoGLM，這是一個智能體（Agent），能夠模擬人類操作手機，執行各種任務。AutoGLM的推出標誌着人工智能在“Phone Use”領域的進步，使得AI的應用更加貼近人們的日常生活。

智譜清言端到端情感語音功能上線：可隨時打斷支持多種語言和方言

智譜AI宣佈，其端到端情感語音技術已正式登陸智譜清言平臺，並向所有用戶開放。這項技術突破了傳統文本轉語音（TTS）技術的侷限，能夠深入理解上下文語境，並生成富有情感的自然對話。這標誌着智譜AI的語音合成技術已經從簡單的文字朗讀進化到能夠表達真實情感的人工智能。

文生圖捲起來了！智譜開源圖像生成模型CogView3 生成速度比SDXL快10倍！

近日，智譜AI向公衆開源了其最新力作——CogView3及其升級版CogView-3Plus-3B，爲文生圖領域注入了新的活力。CogView3的亮相無疑是一個重要里程碑。作爲首個在文本到圖像生成領域實現中繼擴散的模型，它採用了獨特的級聯擴散方法。這種創新性的approach首先生成低分辨率圖像，隨後通過基於中繼的超分辨率技術來完成最終輸出。這不僅大幅提升了生成圖像的質量，還顯著降低了訓練和推理的成本。最令人矚目的是CogView3的性能表現。根據人類評價結果，CogView3在生成質量上超越了當前最先進的

智譜CogView3-Plus模型開源 文生圖技術迎來新紀元