在 AI 圖像生成領域,傳統的文本提示方式已較爲常見。然而,Google 推出的 Whisk 帶來了一種全新的視覺優先的方法。它允許用戶使用圖像作爲輸入來生成和重新混合創意,爲創作者提供了一種更直觀、更具創意的圖像生成體驗。

Hero_hmKlSP6.width-1600.format-webp.png

Whisk 簡介

Whisk 是 Google Labs 推出的一款創新的生成式 AI 工具。它藉助 Gemini 和 Imagen 3 模型,通過用戶輸入的代表主體、場景和風格的圖像來生成新的圖像。該工具主要定位於創意探索,旨在幫助用戶快速生成和迭代各種創意想法,而非用於精確的圖像編輯。目前,Whisk 僅對美國用戶(美國IP)開放,用戶可在 labs.google/whisk 上使用該工具並提供反饋。

截屏2024-12-17 下午3.45.28.jpg

Whisk 功能亮點

  • 圖像驅動的生成:用戶可以通過上傳圖像來確定主體、場景和風格,而不是使用文本提示,這爲不擅長撰寫文本提示的用戶提供了更便捷的方式,例如用戶可以上傳一張貓的圖片作爲主體,一張荷葉的圖片作爲場景,一張有閃亮元素的圖片作爲風格來生成獨特的圖像。
  • 自動生成詳細字幕:Gemini 模型會自動爲用戶上傳的圖像編寫詳細的字幕描述,這些描述會被輸入到 Imagen 3 模型中,以更好地捕捉圖像的關鍵特徵並生成符合用戶意圖的新圖像。
  • 創意重新混合:能夠將不同的主體、場景和風格圖像進行重新混合,創造出獨特的設計,如數字玩偶、琺琅別針等各種創意產品。
  • 本質捕捉而非複製:它捕捉的是輸入圖像的本質特徵,而不是精確複製,這使得生成的圖像具有更多的創意變化空間,但也可能導致結果與用戶預期不完全一致。
  • 可編輯提示:用戶可以查看和編輯底層的提示信息,以便根據自己的需求對生成的圖像進行調整和優化,例如修改顏色、圖案等特徵。

截屏2024-12-17 下午3.50.10.jpg

適用場景

  1. 創意設計:設計師可以使用 Whisk 快速探索不同的設計方向,通過上傳各種相關的圖像來生成創意靈感,如爲一款新產品設計獨特的外觀形象。
  2. 藝術創作:藝術家可以利用 Whisk 進行藝術創作的前期構思,將不同的元素通過圖像輸入的方式進行融合和嘗試,例如創作一幅奇幻主題的繪畫,通過上傳相關的奇幻生物、場景等圖片來獲取創作思路。
  3. 個性化產品定製:對於個性化產品定製行業,如定製徽章、貼紙等,Whisk 可以幫助用戶快速生成各種可能的設計方案,用戶只需上傳代表自己喜好的主體、場景和風格的圖像,即可得到獨特的定製設計。
  4. 廣告營銷:廣告策劃人員可以使用 Whisk 生成各種具有創意的廣告素材,通過上傳與產品相關的主體圖像以及符合品牌形象的場景和風格圖像,快速得到吸引人的廣告圖片,用於線上線下的廣告宣傳。
  5. 教育領域:在教育中,教師可以使用 Whisk 來輔助教學,例如在美術課上,讓學生通過上傳自己感興趣的事物圖片來激發創作靈感,培養學生的創造力和想象力。

截屏2024-12-17 下午3.48.01.jpg

Whisk 使用教程

  1. 訪問工具:美國 IP 用戶可訪問 labs.google/whisk 進入 Whisk 工具頁面。
  2. 上傳圖像:根據需要生成的圖像內容,上傳代表主體、場景和風格的圖像。如果沒有合適的圖像,也可點擊骰子圖標獲取一些建議圖像(這些圖像可能也是 AI 生成的)。
  3. 生成圖像:上傳圖像後,Whisk 會自動根據這些圖像生成新的圖像以及對應的文本提示。
  4. 查看與調整:查看生成的圖像,如果不滿意,可以通過編輯文本框中的提示信息,或者點擊圖像並編輯其相關文本提示來對圖像進行調整和優化。
  5. 下載或收藏:如果對生成的圖像滿意,可以將其下載保存,或者添加到收藏夾中以便後續使用。

截屏2024-12-17 下午3.46.32.jpg

結語

Whisk 作爲一款具有創新性的 AI 圖像生成工具,以其獨特的圖像輸入方式和創意重新混合功能,爲用戶帶來了全新的創意體驗。它在創意設計、藝術創作、個性化產品定製等多個領域都具有潛在的應用價值。雖然目前它僅對美國用戶開放且可能存在一些生成結果不夠完美的情況,但它所代表的視覺優先的 AI 圖像生成方向值得我們關注。

如果你對創意和 AI 圖像生成感興趣,不妨點贊、評論並持續關注 Whisk 的發展,期待它在未來能爲我們帶來更多的驚喜和可能性。