Adobe推出新AI工具可讓聲音設計師通過哼唱和模仿聲音來創作音頻

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 19, 2025

Adobe Research與西北大學聯合開發出一項突破性的AI系統Sketch2Sound，該技術能將簡單的人聲模仿和文字描述轉化爲專業級音效，有望徹底改變聲音設計行業的工作方式。

該系統會分析語音輸入的三個關鍵元素:響度、音色（決定聲音的明亮程度）和音調。然後，系統會將這些特徵與文本描述相結合，生成所需的聲音。

視頻:García 等人，Adobe Research

Sketch2Sound 的有趣之處在於它能夠理解上下文。例如，如果有人輸入“森林氛圍”併發出短促的聲音，系統會自動識別出這些聲音應該是鳥叫聲 - 而無需特定指令。

同樣的智能也適用於音樂。在創建鼓點模式時，用戶可以輸入“低音鼓、小軍鼓”，然後使用低音和高音哼唱節奏。系統會自動將低音鼓放在低音上，將小軍鼓放在高音上。

爲專業人士提供精細控制

研究團隊內置了特殊的過濾技術，讓用戶可以調整控制生成聲音的精確度。聲音設計師可以根據自己的需求選擇精確、細緻的控制或更輕鬆、近似的方法。

這種靈活性使得 Sketch2Sound 對於擬音師（爲電影和電視節目製作音效的專業人士）來說特別有價值。他們無需操縱物理對象來發出聲音，而是可以通過語音和文本描述更快地創建效果。

研究人員指出，輸入錄音的空間音頻特性有時會以不想要的方式影響生成的聲音，但他們正在努力解決這個問題。Adobe 尚未宣佈 Sketch2Sound 何時或是否會成爲商業產品。

泰國AI狂飆突進！Open Source、人才培養、政府政策，多方助力“泰”起飛！

2024年，全球AI熱潮持續高漲，泰國也毫不例外，正站在一場人工智能（AI）大爆發的前夜。想象一下，你正在曼谷的街頭漫步，周圍的一切都在悄然發生着改變，餐廳的智能點餐系統能一口流利泰語與你對話，醫院的AI診斷系統能夠精準地分析你的身體狀況，就連路邊的共享單車都配備了智能導航，這絕不是天方夜譚，而是正在泰國發生的AI變革。圖源備註：圖片由AI生成，圖片授權服務商Midjourney這股浪潮有多猛烈呢? 數據機構 Statista 預測，泰國生成式AI（GenAI）市場將在2024年達到8000萬美元

新研究顯示：Anthropic 的 Claude AI 在合作能力上領先於 OpenAI 和谷歌模型

近日，一項新的研究論文揭示了不同 AI 語言模型在合作能力方面的顯著差異。研究團隊採用了一種經典的 “捐贈者遊戲”，測試了 AI 代理在多代合作中如何共享資源。結果顯示，Anthropic 的 Claude3.5Sonnet 表現出色，成功建立了穩定的合作模式，獲得了更高的資源總量。而谷歌的 Gemini1.5Flash 和 OpenAI 的 GPT-4o 則表現不佳，尤其是 GPT-4o 在測試中逐漸變得不合作，Gemini 代理的合作程度也十分有限。研究團隊進一步引入了懲罰機制，以觀察不同 AI 模型的表現變化。結果發現，Claude3.5的表現有了顯

蘋果或涉足智能門鈴市場，FaceID技術成核心亮點

近期，多家媒體報道稱，蘋果正致力於擴展其智能家居生態系統，通過推出壁掛式智能家居中心等新產品加深與消費者家庭的聯繫。蘋果的這一戰略可能還包括一款基於 FaceID 技術的智能門鈴。這款智能門鈴預計可通過 FaceID 技術在人靠近時掃描面部，與家中的無線門鎖連接，實現自動解鎖功能，爲用戶帶來更便捷的出入體驗。據悉，該產品可能會與支持 Apple HomeKit 的第三方門鎖兼容，也可能通過與特定鎖具製造商合作推出一體化解決方案。不過，該門鈴目前仍處於早期開發階段，最快也要

隱私違規！意大利對OpenAI ChatGP施以1500萬歐元重罰

近日，意大利數據保護機構宣佈對 OpenAI 的人工智能聊天機器人 ChatGPT 處以1500萬歐元的罰款。這一決定是在2023年3月啓動的調查後做出的，調查發現 OpenAI 在多個方面違反了隱私保護法規。圖源備註：圖片由AI生成，圖片授權服務商Midjourney調查指出，OpenAI 在處理個人數據時存在重大失誤。首先，該公司未能及時報告數據泄露事件，這一行爲嚴重影響了用戶的隱私安全。此外，OpenAI 缺乏合法的個人數據處理依據，意味着在沒有適當授權的情況下，用戶的個人信息被非法使用。同時，OpenAI 還違

OpenAI推出ChatGPT新記憶功能:能跨對話回憶用戶交流

OpenAI 宣佈推出一項全新的記憶功能，允許其 AI 助手 ChatGPT 在用戶開啓新對話時，能夠回憶起以往的交流內容。這一更新旨在提升用戶體驗，使得 ChatGPT 能夠更加個性化地迴應用戶的需求。新的記憶功能爲 ChatGPT 增添了對話記憶的能力。用戶可以通過設置面板全面掌控自己的存儲信息，具體操作包括刪除特定的記憶、清除過往對話記錄或歸檔某些聊天記錄以保持私密。用戶對 ChatGPT 的記憶功能擁有完全的控制權。他們可以通過設置刪除特定的記憶，或者從對話歷史中刪除過去的對話記錄。

新一代語言模型ModernBERT發佈，RAG等任務處理速度快四倍、成本低

最近，Answer.AI 和 LightOn 聯合發佈了開源語言模型 ModernBERT，這是對谷歌 BERT 的重大升級。根據開發者的介紹，ModernBERT 在處理速度、效率和質量上都有了顯著提升。該模型可以比其前身快四倍，同時使用更少的內存。ModernBERT 的設計允許它處理長達8192個標記的文本，這比現有編碼模型的典型512標記限制提高了16倍。此外，ModernBERT 還是首個經過廣泛訓練的編程代碼編碼模型，它在 StackOverflow 問答數據集上的得分超過80，創造了編碼模型的新紀錄。在通用語言理解評估（GLUE）中，ModernBERT-Large

Adobe推出新AI工具 可讓聲音設計師通過哼唱和模仿聲音來創作音頻