近日,美團 LongCat 團隊宣佈推出 LongCat-Image 圖像生成模型,並將其開源。這一新模型以6B 參數規模實現了高性能與低門檻的完美結合,旨在滿足當前日益增長的 AI 圖像生成需求。隨着行業對圖像生成技術的期待日益高漲,LongCat-Image 模型應運而生,填補了開源與閉源模型之間的差距。

LongCat-Image 在文生圖和圖像編輯領域的表現十分出色。在圖像編輯方面,模型在多個基準測試中達到了開源 SOTA(State-of-the-Art)水平,充分證明了其在指令遵循和視覺一致性方面的強大能力。團隊通過系統性的訓練策略與數據工程,使得模型在多樣化的指令下,仍能保持高效的性能和準確性。
特別是在中文文字生成方面,LongCat-Image 展現出極高的精準度。模型採用課程學習策略,針對漢字的字符覆蓋和渲染效果進行了全面提升,能夠支持複雜筆畫結構漢字的渲染,滿足海報設計、商業廣告等場景的需求。

此外,LongCat-Image 的設計注重用戶體驗,採用主觀評分方法對模型進行評估,確保在文生圖和圖像編輯任務中的真實度與視覺合理性均達到高水平。這一切的努力使 LongCat-Image 在與其他開源和閉源模型的競爭中脫穎而出,展現出強大的市場潛力。
LongCat 團隊表示,他們希望通過開源的方式構建一個透明、開放、協作的生態系統,鼓勵開發者參與到模型的使用與共建中。用戶可以通過 Hugging Face 和 GitHub 訪問 LongCat-Image,體驗這一高效能模型的強大功能。
爲了進一步拓寬 AI 創作的可能性,LongCat APP 也進行了升級,新增圖生圖功能,用戶可輕鬆上傳各種素材,模型將自動生成全新圖像。同時,APP 提供了24個易用模板,幫助用戶快速實現專業級圖像創作。
地址: https://longcat.ai/
