7月25日,火山引擎在成都舉辦了2024AI 創新巡展。火山引擎宣佈其豆包大模型日均tokens使用量已超過5000億,平均每家企業客戶日均tokens使用量自5月15日模型發佈以來增長了22倍。火山引擎副總裁張鑫表示,火山引擎正在向更智能化、行業化和區域化方向發展,並通過行業方案、產品和優化服務,助力企業實現業務創新。

字節跳動抖音豆包大模型

在會上,火山引擎發佈了豆包大模型的最新能力,包括視覺圖像、語音合成、聲音復刻等方面的升級。豆包·圖生圖模型和豆包·文生圖模型在保留原圖特徵和提升畫面質感方面表現突出。豆包·語音合成模型和豆包·聲音復刻模型則在表達情緒和還原說話人聲音特徵方面有所提升。

  1. 豆包·圖生圖模型:不僅能高度保留原圖的人物輪廓、表情、空間結構等多維特徵,還支持50餘種不同風格,支持圖片擴展、局部重繪和塗抹玩法,讓圖片進行創意延展。現已應用於抖音、剪映、豆包、星繪等應用,並已服務於三星、努比亞等企業,涵蓋了手機相冊、工具助手、電商營銷、廣告投放等多個領域。

  2. 豆包·文生圖模型:深度理解多數量主體、主客體關係、人物構造、空間構造等信息,圖文匹配更精準;更善於從光影明暗、氛圍色彩和人物美感三個方向提升畫面質感;優化中國特色內容,能夠對中國人物、物品、朝代、地理、美食、節日等進行細分理解。

  3. 豆包·語音合成模型:能深度理解故事情節和人物角色,正確表達情緒;保留吞音、口音等發音習慣,媲美真人音色,讓發聲更自然;26個精品超自然音色,滿足多種場景需要。

  4. 豆包·聲音復刻模型:僅需5秒即可複製一個高保真音色,高度還原說話人聲音特徵和口音,支持跨6大語種遷移,發音更接近於當地人表達。

同時,火山方舟提供核心插件和智能體能力,以及全週期數據安全可信方案,幫助企業便捷落地大模型。頭條抖音同款三大插件升級,並新增網頁解析插件和計算器插件,支持企業多樣的應用需求。火山引擎提供釦子專業版,支持低代碼構建契合企業業務場景的專家型“AI Bot”。

火山引擎還打造了HiAgent企業專屬AI應用創新平臺,幫助企業打通擁抱大模型的最後一公里。HiAgent從速度、密度、厚度三個維度全方位賦能企業AI應用的快速落地與持續優化。火山引擎AI全棧雲依託字節跳動的海量資源共池,支持多芯、多雲架構,提供超大規模算力,支持萬卡集羣組網、萬億參數MoE大模型。