Black Forest Labs正式宣佈,其全新圖像編輯模型 FLUX.1Kontext [dev] 現已開源,引發了AI社區的廣泛關注。
這一模型作爲FLUX.1系列的最新成員,以其強大的圖像編輯能力和高效性能被譽爲可媲美GPT-4o的開源替代方案。FLUX.1Kontext [dev] 基於12億參數的流匹配變換器架構,專爲圖像編輯任務設計,支持消費級硬件運行,爲創作者、開發者和研究人員提供了前所未有的靈活性。
核心功能:上下文感知與精準編輯
FLUX.1Kontext [dev] 的最大亮點在於其 上下文感知圖像生成與編輯能力。與傳統僅基於文本提示的圖像生成模型不同,該模型能夠同時理解文本和圖像輸入,實現真正的上下文生成與編輯。
用戶可以通過簡單的文本指令修改現有圖像,例如更改特定區域的顏色、風格或背景,同時保持角色或對象的風格一致性。此外,模型支持多次迭代編輯,最大程度減少視覺漂移,確保圖像質量和一致性。
開源賦能社區創新
作爲開源模型,FLUX.1Kontext [dev] 採用非商業許可,兼容之前的FLUX.1[dev]推理代碼,允許研究人員和藝術家在個人、科研及特定商業場景下自由使用。
Black Forest Labs表示,該模型通過指導蒸餾技術訓練,顯著提升了效率,爲社區提供了定製化開發的可能性。AIbase注意到,模型已在多個平臺上線,包括Replicate、Hugging Face等,社區開發者已開始探索其在藝術創作、內容生成等領域的創新應用。
負責任的AI開發
Black Forest Labs強調對生成式AI技術的負責開發。在FLUX.1Kontext發佈前,團隊通過數據過濾和與Internet Watch Foundation合作,減少了不安全內容生成的風險。
模型輸出內容還採用C2PA標準添加加密簽名元數據,確保內容溯源。此外,Black Forest Labs將通過API監控使用情況,防止違反政策的行爲,展現了其在技術創新與倫理平衡上的努力。
行業影響與未來展望
FLUX.1Kontext [dev] 的開源發佈標誌着圖像編輯領域的又一里程碑。AIbase認爲,其高效的迭代編輯能力和對消費級硬件的適配性,將極大降低專業圖像編輯的門檻,助力更多創作者實現創意。相較於OpenAI的GPT-4o圖像編輯功能,FLUX.1Kontext [dev] 在速度和成本上更具優勢,預計將推動開源社區與閉源模型的競爭。
未來,Black Forest Labs計劃進一步優化模型,並探索文本到視頻的擴展應用,爲生成式AI注入新的活力。
開源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
Github:https://github.com/black-forest-labs/flux