正文

字節跳動開源 VeOmni 框架：提升多模態訓練效率的新利器

發布於AI新閒資訊

時間 :Aug 14, 2025

閱讀 :1分鐘

近日，字節跳動宣佈開源其內部開發的 VeOmni 框架，這是一款專注於多模態模型訓練的統一框架。隨着人工智能技術的不斷髮展，特別是從單一語言模型向文本、圖像和視頻的多模態演進，算法工程師們在訓練過程中面臨諸多挑戰，特別是訓練流程的碎片化問題。爲了應對這些困擾，VeOmni 應運而生。

VeOmni 由字節跳動的 Seed 團隊與火山機器學習平臺共同研發，旨在實現 “統一多模態、統一併行策略和統一算力底座” 的目標。該框架通過提供統一的 API，將多種混合並行策略整合到一個框架中，支持各種模型的快速訓練。無論是大規模語言模型、視覺語言模型，還是視頻生成模型，開發者都可以輕鬆上手。

該框架具備顯著的性能優化能力。例如，它通過顯存計算的雙優化策略，能夠在保證顯存充足的情況下，最大限度地減少額外計算開銷。此外，VeOmni 還採用了多維並行體系，支持不同的並行原語，從而有效降低顯存峯值。這些技術的結合，使得 VeOmni 在實際訓練中表現出色，相比同類開源方案，其訓練吞吐量提升了40% 以上。

在蒸餾加速方面，VeOmni 也展現了其強大的優勢。通過集成多種前沿的蒸餾技術，用戶可以顯著減少模型推理所需的步驟和資源消耗，從而加速模型的部署和應用。

VeOmni 框架的開源，不僅提升了字節跳動內部模型訓練的效率，也爲更多的 AI 研究者和開發者提供了一個強大的工具，助力多模態 AI 技術的發展。

劃重點:
🌟 VeOmni 框架是字節跳動專爲多模態模型訓練開發的統一框架，旨在解決訓練過程中的碎片化問題。
⚡ 該框架通過顯存計算和混合並行策略顯著提高訓練效率，訓練吞吐量提升超過40%。
🚀 VeOmni 集成前沿的蒸餾技術，幫助用戶減少模型推理步驟，加速模型部署。

字節豆包 AI 手機項目生變：硬件負責人離職，項目進入“調整期”

字節跳動AI硬件團隊Ocean核心成員、豆包手機硬件產品負責人林夕近期離職，成爲公司2024年啓動AI手機項目以來首位核心硬件負責人出走，引發外界對項目前景的猜測。內部消息人士否認“豆包手機項目徹底消失”傳聞，稱項目並未關停，而是轉入新調整階段。

Jul 3, 2026

269.8k

豆包內測社交功能:打通飛書賬號，AI助手也要做熟人社交?

字節跳動旗下AI助手豆包正灰度測試社交功能，已打通飛書賬號體系。內測新增獨立“對話”頁面，支持添加豆包好友或飛書好友；收到好友申請時AI會自動發送打招呼消息，已添加的人類好友對話列表中將顯示“人類”標識。

Jun 29, 2026

193.0k

字節Seedance 2. 5 七月上線， 50 個素材同時輸入，還能"魔改"周星馳電影

火山引擎在2026原動力大會上發佈豆包視頻生成模型Seedance 2.5，實現跨越式升級。新模型支持單段原生30秒視頻直出，可同時導入最多50個全模態素材，生成可控性大幅提升。目前全球企業內測，預計7月初正式上線。

Jun 23, 2026

266.1k

字節跳動火山引擎 2026 大會重磅發佈：Seedance 2.5 直出 30 秒視頻，豆包 2.1 Pro 對標 Opus 4.6

字節跳動發佈視頻生成模型Seedance2.5，支持單次直出30秒完整視頻，標誌視頻生成邁入長序列時代。同時推出多模態模型豆包Seed2.1及圖像模型Seeddream5.0，提升其在AI領域的競爭力。

Jun 23, 2026

1,015.7k

加碼國產算力：字節跳動擬採購 5 萬顆AI芯片，國產GPU陣營再添新主力

字節跳動計劃與國內高性能計算廠商天數智芯洽談，大規模採購約5萬顆AI芯片，主要用於部署推理任務場景，以支持其AI聊天機器人“豆包”的迭代和用戶增長。此舉反映AI大模型用戶規模擴張下，算力基礎設施自主可控成爲科技企業戰略重心。

Jun 16, 2026

289.4k

智啟未來，您的人工智能解決方案智庫