Meta近日發佈了一款名爲"Imagine yourself"的創新AI模型,它能夠僅憑一張參考照片,生成各種個性化圖像,無需額外訓練。這項技術突破讓人彷彿置身魔法世界,能夠在不同姿勢、風格和環境中展示同一個人。
與傳統AI模型不同,"Imagine yourself"採用全新的運作方式。它能同時處理照片和文本指令,靈活應對新的要求和人物,大大提高了效率和適應性。爲實現這一突破,Meta在技術上做了兩項關鍵創新:
利用合成訓練數據:通過生成與真實照片對應的合成變體,讓模型學會更加生動多樣地展示人物,而非簡單複製參考圖像。
全新架構設計:搭載三個平行的文本處理模塊和一個可訓練的圖像處理模塊,實現了圖像和文本的更好協調。
根據Meta的說法,"Imagine yourself"在處理複雜指令時表現優異,如改變表情、頭部姿勢,甚至將人物置於全新環境中。雖然在身份保留方面偶有不及其他模型之處,但這主要是因爲競爭對手往往簡單複製參考圖像,導致結果不夠自然。
值得一提的是,這個模型還能擴展到多人圖像生成,通過並行處理多個參考圖像,輕鬆製作出一羣人在新姿勢和環境中的照片。
儘管"Imagine yourself"已經展現出驚人的能力,Meta仍在持續改進。未來,他們計劃將技術擴展到視頻生成,甚至處理複雜姿勢如跳躍等。雖然目前模型和代碼尚未公開,但可以預見,這項技術將引領個性化圖像生成的新潮流,爲創意產業帶來革命性變革。
隨着AI技術不斷進步,我們期待看到更多令人驚歎的應用出現,推動視覺創作和個性化內容生成向前發展。Meta的這一突破無疑爲未來AI圖像處理技術指明瞭新的方向。