字節跳動火山引擎發佈豆包·音樂模型、同聲傳譯模型

在今日的2024火山引擎 AI 創新巡展上，除了視頻生成模型，字節跳動還發佈了豆包·音樂模型和豆包·同聲傳譯模型，並宣佈對豆包通用模型pro、文生圖模型、語音合成模型等垂類模型進行了大幅升級。

微信截圖_20240924154634.png

豆包·音樂模型的推出，標誌着火山引擎在音樂創作領域的深度佈局。該模型通過強大的算法支持，實現了高品質的音樂創作自由。歌詞生成方面，僅需簡單幾個字的輸入，即可快速生成情感表達精準、意境深遠的歌詞內容。旋律創作上，豆包·音樂模型提供了超過10種不同的音樂風格和情緒表達選項，滿足了創作者多樣化的需求。

同時，藉助豆包強大的語音合成技術，演唱效果逼真，幾可亂真，爲用戶帶來沉浸式的聽覺享受。此外，該模型還降低了音樂創作的門檻，支持圖片成曲、靈感成曲、寫詞成曲等多種創作方式，讓更多人能夠輕鬆參與到音樂創作中來。

微信截圖_20240924153132.png

另一方面，豆包·同聲傳譯模型的發佈，則爲跨語言溝通帶來了革命性的變化。該模型實現了實時翻譯的超低延時，用戶在說話的同時即可看到翻譯結果，極大地提升了溝通效率。翻譯質量方面，豆包·同聲傳譯模型以流暢自然、準確率高的表現，在辦公、法律、教育等多個場景中接近甚至超越了人類同傳水平。尤爲值得一提的是，該模型還支持音色克隆功能，能夠實現跨語言同音色翻譯，以更加生動、逼真的聲音表現力打破溝通壁壘，讓跨語言交流變得更加順暢無阻。

體驗地址:https://www.volcengine.com/product/doubao

火山引擎發佈豆包音頻生成模型1.0：一句話生成影視級音頻，角色聲音 10 分鐘都不"串戲"

火山引擎發佈豆包音頻生成模型1.0，支持文本或音頻輸入，端到端生成完整音頻作品。核心突破是單條Prompt即可同步生成對白、音效和背景音樂，無需傳統多軌剪輯。該技術大幅簡化音頻製作流程，讓用戶像“音頻導演”一樣高效產出成片級音頻，徹底告別手動對齊混音的複雜後期工作。

火山引擎發佈豆包2.1Pro:日常功能確認免費，將推專業版辦公模式

2026年6月23日火山引擎FORCE大會，字節跳動發佈豆包大模型重大升級：推出2.1Pro，聚焦編程、智能體與視覺語言模型；同時發佈視頻生成模型Seedance 2.5及2.04K版、圖像生成模型Seedream 5.0 Pro、音頻生成模型1.0。2.1Pro已開放API並接入釦子生態。火山引擎總裁譚待表示，豆包面向用戶的日常基礎功能（如搜索問答）將持續免費。

字節跳動火山引擎發佈豆包·音樂模型、同聲傳譯模型

相關推薦

火山引擎發佈豆包音頻生成模型1.0：一句話生成影視級音頻，角色聲音 10 分鐘都不"串戲"

豆包音頻生成模型1. 0 發佈，開啓“音頻導演”時代

豆包視頻生成大模型 Seedance 2.5 亮相，將於 7 月初正式發佈

火山引擎發佈豆包2.1Pro:日常功能確認免費，將推專業版辦公模式

字節Seedance 2. 5 七月上線， 50 個素材同時輸入，還能"魔改"周星馳電影