在今日的2024火山引擎 AI 創新巡展上,除了視頻生成模型,字節跳動還發佈了豆包·音樂模型和豆包·同聲傳譯模型,並宣佈對豆包通用模型pro、文生圖模型、語音合成模型等垂類模型進行了大幅升級。
豆包·音樂模型的推出,標誌着火山引擎在音樂創作領域的深度佈局。該模型通過強大的算法支持,實現了高品質的音樂創作自由。歌詞生成方面,僅需簡單幾個字的輸入,即可快速生成情感表達精準、意境深遠的歌詞內容。旋律創作上,豆包·音樂模型提供了超過10種不同的音樂風格和情緒表達選項,滿足了創作者多樣化的需求。
同時,藉助豆包強大的語音合成技術,演唱效果逼真,幾可亂真,爲用戶帶來沉浸式的聽覺享受。此外,該模型還降低了音樂創作的門檻,支持圖片成曲、靈感成曲、寫詞成曲等多種創作方式,讓更多人能夠輕鬆參與到音樂創作中來。
另一方面,豆包·同聲傳譯模型的發佈,則爲跨語言溝通帶來了革命性的變化。該模型實現了實時翻譯的超低延時,用戶在說話的同時即可看到翻譯結果,極大地提升了溝通效率。翻譯質量方面,豆包·同聲傳譯模型以流暢自然、準確率高的表現,在辦公、法律、教育等多個場景中接近甚至超越了人類同傳水平。尤爲值得一提的是,該模型還支持音色克隆功能,能夠實現跨語言同音色翻譯,以更加生動、逼真的聲音表現力打破溝通壁壘,讓跨語言交流變得更加順暢無阻。
體驗地址:https://www.volcengine.com/product/doubao