近日,Adobe Research 與西北大學合作開發了一款名爲 Sketch2Sound 的人工智能系統,這一工具有望徹底改變聲音設計師的工作方式。Sketch2Sound 能夠讓用戶通過哼唱、模仿聲音以及用簡單的文本描述來創建專業的音效和氛圍音。
這個系統分析了用戶聲帶輸入的三個關鍵要素:音量、音色(決定聲音的明亮或陰暗)和音高。隨後,它將這些特徵與用戶的文本描述相結合,從而生成所需的聲音。例如,用戶在輸入 “森林氛圍” 併發出短促的聲響時,系統會自動將這些聲響識別爲鳥鳴,而無需具體的指令。
Sketch2Sound 的另一大亮點在於它對上下文的理解能力。在製作音樂時,用戶可以輸入 “低音鼓、軍鼓”,並通過哼唱出節奏。系統會智能地將低音鼓放在低音音符上,而軍鼓則置於高音音符上。這種智能化的處理大大簡化了聲音設計的過程。
爲了滿足專業人士的需求,研究團隊還內置了特殊的過濾技術,使用戶可以根據需要調整生成聲音的精確度。聲音設計師可以選擇非常準確的控制,或是更放鬆、近似的方式,這種靈活性可能使 Sketch2Sound 特別受 Foley 藝術家的歡迎。這些專業人士負責爲電影和電視節目創作音效,使用這一工具後,他們可以通過聲音和文本描述更快速地創造效果,而不必再操控實物來發聲。
雖然研究人員指出,輸入錄音中的空間音頻特性有時會對生成的聲音產生不良影響,但他們正在努力解決這個問題。目前,Adobe 尚未宣佈 Sketch2Sound 是否會推出商業產品或具體的發佈時間。
項目入口:https://hugofloresgarcia.art/sketch2sound/
劃重點:
🎵 Sketch2Sound 是一個新開發的 AI 工具,能通過哼唱和文本描述來創建音效。
🔊 該系統分析音量、音色和音高,將用戶的聲音輸入與文本結合生成目標音效。
🎬 特別適合 Foley 藝術家使用,能夠快速生成影視音效,提升工作效率。