在圖像處理領域,摳圖——也就是將圖像中的前景對象從背景中分離出來的技術——一直是一個挑戰。現在,一種名爲“Matting by Generation”的新技術,正在用生成模型重新定義摳圖的精準度和效率。
這項技術的核心在於它的自動化能力。傳統摳圖方法往往需要用戶輸入輔助信息,比如輪廓標記或特定的顏色。而“Matting by Generation”則不同,它僅依賴單張輸入圖像,就能夠自動提取前景對象,無需任何額外的輸入。
對於那些具有複雜邊界的對象,如頭髮絲、動物毛髮、鞋帶等,傳統的摳圖方法常常力不從心。但“Matting by Generation”在這些方面表現出色,能夠生成接近真實感的邊界效果,這得益於其先進的潛在擴散模型,這種模型能夠更好地理解和重建圖像的複雜細節。

“Matting by Generation”方法的一個顯著特點是它結合了大量的預訓練知識。這意味着模型在處理圖像時,不僅僅是分析當前的輸入,而是利用了廣泛的數據和模式,從而提高了摳圖的精確度和細節的豐富性。
儘管“Matting by Generation”可以在沒有額外輸入的情況下工作,但它也可以使用多種輔助信息來提高摳圖的準確性。無論是文本描述、簡單的圖像標記還是塗鴉,模型都能夠整合這些信息,更準確地識別前景和背景。
假設你有一個圖像,你可以簡單地用一句話描述圖像中的前景,比如“一隻坐在草地上的小貓”,或者用塗鴉標記出你想要摳出的區域。“Matting by Generation”模型將利用這些提示,生成更準確的前景圖像。
“Matting by Generation”代表了圖像摳圖技術的一個巨大飛躍。它不僅提高了工作效率,更在質量上達到了新的高度。隨着技術的不斷髮展,我們可以期待它在未來的應用中將如何進一步改變我們對圖像處理的認知。
論文地址:https://arxiv.org/pdf/2407.21017
