美團重磅開源 6B 參數圖像生成模型 LongCat-Image，中文文字生成與圖像編輯達SOTA水平

近日，美團 LongCat 團隊宣佈推出 LongCat-Image 圖像生成模型，並將其開源。這一新模型以6B 參數規模實現了高性能與低門檻的完美結合，旨在滿足當前日益增長的 AI 圖像生成需求。隨着行業對圖像生成技術的期待日益高漲，LongCat-Image 模型應運而生，填補了開源與閉源模型之間的差距。

LongCat-Image 在文生圖和圖像編輯領域的表現十分出色。在圖像編輯方面，模型在多個基準測試中達到了開源 SOTA（State-of-the-Art）水平，充分證明了其在指令遵循和視覺一致性方面的強大能力。團隊通過系統性的訓練策略與數據工程，使得模型在多樣化的指令下，仍能保持高效的性能和準確性。

特別是在中文文字生成方面，LongCat-Image 展現出極高的精準度。模型採用課程學習策略，針對漢字的字符覆蓋和渲染效果進行了全面提升，能夠支持複雜筆畫結構漢字的渲染，滿足海報設計、商業廣告等場景的需求。

此外，LongCat-Image 的設計注重用戶體驗，採用主觀評分方法對模型進行評估，確保在文生圖和圖像編輯任務中的真實度與視覺合理性均達到高水平。這一切的努力使 LongCat-Image 在與其他開源和閉源模型的競爭中脫穎而出，展現出強大的市場潛力。

LongCat 團隊表示，他們希望通過開源的方式構建一個透明、開放、協作的生態系統，鼓勵開發者參與到模型的使用與共建中。用戶可以通過 Hugging Face 和 GitHub 訪問 LongCat-Image，體驗這一高效能模型的強大功能。

爲了進一步拓寬 AI 創作的可能性，LongCat APP 也進行了升級，新增圖生圖功能，用戶可輕鬆上傳各種素材，模型將自動生成全新圖像。同時，APP 提供了24個易用模板，幫助用戶快速實現專業級圖像創作。

地址： https://longcat.ai/

AI 研究進入“自動駕駛”時代：楊植麟談大模型訓練的第三階段

人工智能研究範式正經歷深刻蛻變。在2026中關村論壇年會上，月之暗面創始人楊植麟指出，AI研發已進入“AI主導研究”的第三階段。從2026年起，研究方式將發生質的飛躍，過去AI模型迭代高度依賴人類研究員規則設計與精細調優的範式將被顛覆，AI將逐步主導自身研發。

美團重磅開源 6B 參數圖像生成模型 LongCat-Image，中文文字生成與圖像編輯達SOTA水平

相關推薦

AI 研究進入“自動駕駛”時代：楊植麟談大模型訓練的第三階段

體驗再升級！谷歌Gemini個性化AI繪圖功能對美國用戶免費開放

資本市場新寵：智譜市值突破萬億，國產大模型迎來高光時刻

從生成圖像到醫療影像，Midjourney 推出全身超聲掃描儀

智譜GLM-5. 2 全量開源，力推前沿智能全民化