用一段簡單的哼唱、一段節奏的敲擊,就能讓AI生成一段高品質的音樂或音效,這不再是幻想。一項名爲Sketch2Sound的創新研究成果,展示了一種全新的AI模型,它可以通過聲音模仿和文本提示來生成高質量的音頻,爲聲音創作領域帶來了革命性的突破。


用一段簡單的哼唱、一段節奏的敲擊,就能讓AI生成一段高品質的音樂或音效,這不再是幻想。一項名爲Sketch2Sound的創新研究成果,展示了一種全新的AI模型,它可以通過聲音模仿和文本提示來生成高質量的音頻,爲聲音創作領域帶來了革命性的突破。

軟銀向OpenAI追加投資225億美元,總投資達325億美元,佔其400億美元融資計劃的75%。此舉展現軟銀對通用人工智能的堅定信心,並助力OpenAI衝刺IPO,凸顯資本對AI未來的強力押注。
AI音樂生成平臺ElevenLabs推出"Eleven Music"服務,用戶通過簡單英文提示即可快速生成包含人聲和樂器的完整音樂作品。該公司已與Merlin Network和Kobalt Music Group達成合作協議,確保AI訓練使用合法授權內容,爲商業應用提供法律保障。服務面向企業客戶,應用於影視、遊戲等多個領域。儘管AI音樂帶來便利,但行業仍面臨版權爭議,需平衡技術創新與創作者權益保護。
在 AI 音樂生成公司 Suno AI 的 CEO 米基.舒爾曼最近在 “20VC” 播客上的發言引發了廣泛的討論。他表示,“現在創作音樂並不真正令人愉悅,” 並認爲大多數人並不享受制作音樂的過程。他指出,創作音樂需要耗費大量時間和精力,掌握樂器或製作軟件的技能也是一項挑戰。舒爾曼的言論被認爲是非常自我服務的,因爲 Suno AI 正是希望吸引那些對傳統音樂創作感到沮喪的受衆。他認爲,音樂的創作過程應該變得更簡單、更快速。圖源備註:圖片由AI生成,圖片授權服務商Midjourney他表示,Sun
近日,AI 音樂生成公司 Suno AI 的首席執行官米奇・舒爾曼(Mikey Shulman)在《20VC》播客中發表了一番引人注目的言論。他認爲,大多數人並不享受創作音樂的過程,反而覺得這是一項繁瑣且耗時的工作。舒爾曼表示,製作音樂需要大量的時間和練習,人們需要掌握樂器或製作軟件才能夠創造出音樂,而這往往讓人感到沮喪。圖源備註:圖片由AI生成,圖片授權服務商Midjourney他進一步指出:“大多數人在創作音樂時,不會享受大部分時間。” 舒爾曼的觀點引起了廣泛的爭議,很多人認爲這樣的
近日,阿里巴巴達摩院的研究團隊發佈了一項重要研究成果,名爲 “SHMT:自監督層次化妝轉移”,該論文已被國際頂級學術會議 NeurIPS2024接收。這項研究展示了一種新的化妝效果轉移技術,利用潛在擴散模型(Latent Diffusion Models)來實現化妝圖像的精準生成,爲化妝應用和圖像處理領域注入了新活力。簡單的說,SHMT是一項妝容遷移技術,只要一個化妝的參考圖,和一張目標角色照片,就可以把妝容效果遷移到該目標臉上。團隊在項目中採用了開源的方式,發佈了訓練代碼、測試代碼以及預