字節跳動正式推出其最新的豆包大模型1.5Pro(Doubao-1.5-pro),這一新模型在多個領域的綜合能力上表現出色,成功超越了行業內知名的 GPT-4o 和 Claude3.5Sonnet。該模型的發佈標誌着字節跳動在人工智能領域又向前邁出了重要一步。
豆包1.5Pro 採用了新型的稀疏 MoE(混合專家)架構,使用較小的激活參數進行預訓練。這種設計的創新之處在於其可以提供等效於7倍激活參數的 Dense 模型性能,使其在效率上遠超行業常規的 MoE 架構,帶來了約3倍的效率提升。這樣的設計使得豆包大模型在知識、代碼、推理和中文等多個測評基準上的得分更加出色。
除了主要模型的升級,字節跳動還同時發佈了豆包視覺理解模型 Doubao-1.5-vision-pro 和豆包實時語音模型 Doubao-1.5-realtime-voice-pro。新款視覺理解模型在多模態數據處理、動態分辨率和細粒度信息理解等方面進行了全面技術升級,進一步提升了其在視覺推理和文本理解方面的能力。同時,實時語音模型的推出使得豆包 App 能夠實現更加流暢的語音對話體驗,具備低延遲和對話中隨時打斷的能力。
字節跳動官方表示,豆包大模型在訓練過程中未使用任何外部模型生成的數據,確保了模型的獨立性與可靠性。此外,所有新產品的定價將保持不變,用戶可在豆包 App 中直接體驗新功能。
這次發佈會不僅展示了字節跳動在 AI 領域的持續創新能力,也爲開發者提供了強大的 API 支持,進一步推動了人工智能技術的普及與應用。