AI音頻新技術MMAudio：輸入視頻或文本可自動給視頻配音效

近日，來自伊利諾伊大學厄巴納 - 香檳分校、Sony AI 及 Sony 集團公司的研究團隊推出了一項名爲 MMAudio 的新技術，該技術旨在通過多模態聯合訓練，實現高質量的視頻到音頻合成。

MMAudio 的核心創新在於能夠利用視頻和文本輸入生成同步的音頻，從而拓展了音頻生成的應用場景，支持輸入視頻或文本，生成符合視頻內容的音效。

MMAudio 的設計使其能夠在各種視聽和音頻文本數據集上進行訓練。這種多模態聯合訓練的方式，不僅提高了合成音頻的質量，還確保了生成的音頻與視頻幀之間的同步。這一同步模塊的引入，極大地增強了音頻生成的精確度，確保了音頻和視頻內容的一致性。

目前，MMAudio 的代碼庫仍在建設中，研究人員表示單個示例推理功能已經可以正常使用，而訓練代碼則將在後續版本中推出。爲了便於用戶使用，該技術已在 Ubuntu 操作系統上進行測試，並提供了相關的安裝指南。用戶需要準備 Python3.9及以上版本，以及適當版本的 PyTorch 和 ffmpeg，隨後可以通過簡單的命令安裝 MMAudio。

MMAudio 在生成音頻時仍存在一些侷限性，比如偶爾會產生不清晰的語音或背景音樂，同時對某些陌生概念的處理也不夠理想。研究團隊認爲，增加高質量的訓練數據能夠幫助解決這些問題。隨着研究的不斷推進，MMAudio 有望在未來進一步優化其性能。

試玩:https://huggingface.co/spaces/hkchengrex/MMAudio

代碼:https://github.com/hkchengrex/MMAudio

劃重點:
🌟 MMAudio 技術通過多模態聯合訓練，實現視頻與音頻的高質量合成。
📦 用戶可通過簡單安裝步驟，在 Ubuntu 上使用 MMAudio 進行音頻生成。
⚠️ 當前版本存在一些侷限性，但研究團隊正致力於通過增加訓練數據來改善性能。

AI音頻公司確認“三隻羊錄音門”音頻爲克隆事件

深圳市睿域科技有限公司近日發佈聲明，確認9月16日傳播的音視頻資料中音頻部分爲嫌疑人使用其自主研發的Reecho睿聲AI配音大模型平臺克隆而成。該音頻源自盧某的直播片段。公司已啓動內部審覈機制，強化用戶身份認證和音頻生成的安全管控，以確保技術的合法合規應用。Reecho睿聲表示，言域科技作爲一家成立不到一年的初創團隊，我們致力於音頻與擬人化人工智能的前沿技術探索。Reecho睿聲作爲我們第一款面向大衆的AI音頻合成與配音技術平臺，旨在通過自研尖端技術來提升創意內容

AI寫作平臺 Writingtools.ai 再升級！“自動發佈”功能上線，內容創作進入新紀元

先進的AI寫作平臺 Writingtools.ai 今日隆重宣佈，推出全新功能“自動發佈至您的網站”。憑藉可安排的發佈選項，Writingtools.ai的這項AI寫作功能旨在終結營銷人員和內容創作者在內容發佈方面的困擾。Writingtools.ai網站創始人凡妮莎·諾沃德表示:“Writingtools.ai平臺擁有強大的內容生成工具，可以極大地幫助銷售和營銷團隊找到合適的語調和內容風格。Writingtools.ai不僅是一個新聞文章生成器或新聞稿撰寫工具，我們AI寫作平臺簡潔明瞭的界面也使其成爲全球內容團隊的可靠解決方案。”圖源備註

AI Agent初創公司RapidCanvas獲得1600萬美元融資，助力解決技術人才短缺問題

位於奧斯丁的初創公司 RapidCanvas 近日宣佈完成了一輪1600萬美元的 A 輪融資，旨在推動其 AI Agent技術的發展。這些 AI Agent能夠自動化處理數據科學家和工程師傳統上所承擔的高達75% 的複雜任務。此次融資由 Peak XV Partners 領投，Titanium Ventures、Accel 和 Valley Capital Partners 參與，這使得 RapidCanvas 自2021年成立以來的總融資額達到了2350萬美元。RapidCanvas 希望通過其 “服務即軟件” 的模式，結合 AI Agent與人類專業知識，來應對全球技術人才短缺的問題。這款平臺的混合模式允許企業減少對技術人才

Adobe 年度業績不如預期，AI 崛起或奪走市場份額！

美國軟件公司 Adobe Inc. 在延長交易中股價大跌，原因是公司發佈的年度銷售預期令人失望。這一消息引發了市場對 Adobe 在競爭日益激烈的人工智能領域可能失去市場份額的擔憂。根據 Adobe 的聲明，預計到2025年11月，公司的年度收入將達到234億美元，而分析師們的平均預期則爲238億美元。Adobe 是一家以創意軟件聞名的公司，近年來一直在其產品中增加生成式人工智能（AI）功能。例如，該公司在 Photoshop 等應用程序中嵌入了其自主開發的 AI 模型 Firefly。此外，Adobe 在其年度用戶大會上推出了

暢銷書作家稱 AI 加速了圖書出版的衰退

近年來，美國的讀書人數正在逐漸減少。根據2024年國家圖書調查的數據顯示，近一半（48.5%）的受訪者在過去一年內沒有讀過一本書，而喜歡爲了娛樂而閱讀的人不到三分之一。著名商業作家塞斯・戈丁(Seth Godin)在一次視頻通話中表示，這一現象主要是由於人們過於沉迷於網絡連接。圖源備註:圖片由AI生成，圖片授權服務商Midjourney戈丁指出，人們在閱讀書籍時，常常會中斷去查看電子郵件、瀏覽社交媒體或觀看視頻，而幾乎沒有人會在使用這些現代工具時主動選擇閱讀。因此，文化正逐漸