站長之家(ChinaZ.com) 6月18日 消息:ElevenLabs 是一家專注於音頻生成技術的公司,最近他們宣佈將涉足視頻生成領域。他們開源了一個項目,該項目可以自動爲上傳的視頻配音,生成合適的音效。

這個項目是基於他們的文本生成音效工具開發的,可以說是谷歌 V2A 的弱化版本。現在,用戶已經可以使用這個工具了。

在6月初,ElevenLabs 推出了一項新的功能,用戶可以通過輸入文本來生成各種逼真的音樂特效。這項功能對於電影、遊戲、短視頻等行業來說,無疑是一個巨大的幫助。它讓用戶不再需要費時費力地尋找合適的音效,而且大部分音效還得到了 Shutterstock 的商業授權。

除了音效生成功能,ElevenLabs 還提供了其他強大的功能,如語音克隆和文本轉語音。用戶可以上傳一段語音進行特徵提取,用於生成新的文本內容;也可以將大段文本轉換成有感情的聲音,爲內容賦予更生動的表現形式。雖然中文支持較差,但對於生成英文內容效果非常出色。

文本轉音頻入口:https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi

視頻自動配音入口:https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api