Adobe推新AI音頻具Sketch2Sound ，只需哼唱和模仿聲音就能創建音效

近日，Adobe Research 與西北大學合作開發了一款名爲 Sketch2Sound 的人工智能系統，這一工具有望徹底改變聲音設計師的工作方式。Sketch2Sound 能夠讓用戶通過哼唱、模仿聲音以及用簡單的文本描述來創建專業的音效和氛圍音。

這個系統分析了用戶聲帶輸入的三個關鍵要素:音量、音色（決定聲音的明亮或陰暗）和音高。隨後，它將這些特徵與用戶的文本描述相結合，從而生成所需的聲音。例如，用戶在輸入 “森林氛圍” 併發出短促的聲響時，系統會自動將這些聲響識別爲鳥鳴，而無需具體的指令。

Sketch2Sound 的另一大亮點在於它對上下文的理解能力。在製作音樂時，用戶可以輸入 “低音鼓、軍鼓”，並通過哼唱出節奏。系統會智能地將低音鼓放在低音音符上，而軍鼓則置於高音音符上。這種智能化的處理大大簡化了聲音設計的過程。

爲了滿足專業人士的需求，研究團隊還內置了特殊的過濾技術，使用戶可以根據需要調整生成聲音的精確度。聲音設計師可以選擇非常準確的控制，或是更放鬆、近似的方式，這種靈活性可能使 Sketch2Sound 特別受 Foley 藝術家的歡迎。這些專業人士負責爲電影和電視節目創作音效，使用這一工具後，他們可以通過聲音和文本描述更快速地創造效果，而不必再操控實物來發聲。

雖然研究人員指出，輸入錄音中的空間音頻特性有時會對生成的聲音產生不良影響，但他們正在努力解決這個問題。目前，Adobe 尚未宣佈 Sketch2Sound 是否會推出商業產品或具體的發佈時間。

項目入口:https://hugofloresgarcia.art/sketch2sound/

劃重點:
🎵 Sketch2Sound 是一個新開發的 AI 工具，能通過哼唱和文本描述來創建音效。
🔊 該系統分析音量、音色和音高，將用戶的聲音輸入與文本結合生成目標音效。
🎬 特別適合 Foley 藝術家使用，能夠快速生成影視音效，提升工作效率。

會“僞裝”的AI：最新研究表明人們普遍認定人工智能比人類更自信

最新研究顯示，人們普遍認爲AI比人類更有自信，即使兩者回答完全相同。滑鐵盧大學與倫敦大學學院團隊在《通訊·心理學》發表論文，將這種現象稱爲“自信錯覺”。研究表明，當無法直接判斷對方確信程度時，人們傾向於高估AI的自信水平，這可能影響日常決策中對AI建議的接受度。

Cohere 與 Aleph Alpha 達成 200 億美元跨大西洋人工智能合作

加拿大初創企業Cohere與德國初創企業Aleph Alpha達成200億美元合作，共同開發“主權”人工智能系統，旨在建立不依賴美國和中國的人工智能架構，推進跨大西洋技術自主性。Cohere專注自然語言處理，Aleph Alpha擅長推理模型，雙方將結合技術優勢，加速AI自主發展。

比爾・蓋茨:AI 重塑工作格局，三類職業難以被取代

近日，微軟聯合創始人比爾・蓋茨就 AI 對工作的影響發表了引人深思的觀點。蓋茨提出，工作並非人類與生俱來的使命，它是短缺時代的產物，其核心是依靠人類智慧來提供多樣服務。蓋茨展望未來，認爲 AI 革命將在十年內對傳統行業進行深度變革。在醫療和教育領域，人工智能系統預計將承擔超過80% 的常規診斷、藥品研發和知識傳授工作。AI 憑藉精準算法和不間斷運行，不僅能極大提升服務效率，還可能重塑人類獲取醫療和教育資源的基本邏輯。同時，蓋茨指出有三種職業難以被 AI 取

付費AI驅動營收飆升，OpenAI預計今年營收暴增超兩倍

據最新報道，憑藉其強大的付費人工智能軟件，OpenAI預計將在2025年迎來營收的爆發式增長，從去年的37億美元躍升至驚人的127億美元，增幅超過兩倍。OpenAI對未來發展持樂觀態度，預計明年營收將繼續保持高速增長，有望突破294億美元，展現出巨大的市場潛力。自兩年多前推出現象級產品ChatGPT以來，OpenAI積極構建多元化的訂閱服務，面向消費者和企業市場。這一戰略已初見成效，去年9月，公司宣佈其企業版ChatGPT的付費用戶已突破100萬，標誌着其商業化進程的穩健推進。然而，高速增長的

全新AI系統精準檢測醫學影像的變化