在今日下午舉行的華爲開發者大會HDC2025主題演講中,華爲常務董事、華爲雲計算CEO張平安宣佈正式發佈盤古大模型5.5,標誌着自然語言處理(NLP)、計算機視覺(CV)、多模態、預測、科學計算五大基礎模型迎來全面升級。
盤古自然語言處理NLP大模型方面,全新的718B深度思考模型作爲由256個專家組成的MoE大模型,在知識推理、工具調用、數學等領域的能力實現大幅提升,處於行業領先地位。盤古大模型基於昇騰雲的全棧軟硬件訓練而成,彰顯了昇騰架構打造世界一流大模型的實力。此外,盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行了升級,通過自適應快慢思考合一技術,使模型能根據問題難易程度自動切換思考模式,整體推理效率提升8倍。盤古深度研究DeepDiver藉助長鏈難題合成、漸進式獎勵等技術,在網頁搜索、常識性問答等應用上展現出高效執行能力,如5分鐘內完成超過10跳的複雜問答、生成萬字以上專業調研報告,顯著提升了工作效率。
在盤古預測大模型領域,採用業界首創的triplet transformer統一預訓練架構,對不同行業的數據進行統一編碼和處理,極大提升了預測精度和跨行業、跨場景的泛化性。
盤古科學計算大模型方面,華爲雲持續深化其與科學應用領域的結合。深圳氣象局基於盤古升級了“智霽”大模型,實現AI集合預報,更直觀地反映天氣系統演變可能性,減少預報誤差。重慶市氣象局針對成渝地區降水特點,打造了“天資・12h”氣象大模型,提升災害天氣日內預報預警能力。深圳能源則採用盤古進行中短期風光水發電量預測,減少棄電現象,提升能源開發效率。
盤古計算機視覺CV大模型方面,華爲雲發佈了全新MoE架構的300億參數視覺大模型,這是目前業界最大的視覺模型,全面支持多維度、泛視覺的感知、分析與決策。同時,盤古CV大模型通過跨維度生成模型,構建了工業場景稀缺的泛視覺故障樣本庫,極大提升了業務場景的可識別種類與精度。
盤古多模態大模型方面,全新發布了基於盤古多模態大模型的世界模型,爲智能駕駛、具身智能機器人的訓練構建數字物理空間,實現持續優化迭代。在智能駕駛領域,盤古世界模型能生成大量訓練數據,無需依賴高成本的路採,爲智能駕駛的發展提供了有力支持。
此外,在華爲雲盤古大模型5.5發佈後,其進一步拓展應用場景,推出了五款具備深度思考能力的行業自然語言大模型。這五款大模型分別爲盤古醫學Thinking大模型、盤古金融Thinking大模型、盤古政務Thinking大模型、盤古工業Thinking大模型以及盤古汽車Thinking大模型,旨在爲不同行業提供更專業、更智能的自然語言處理解決方案。據悉,這五款大模型很快將正式上線,屆時將爲各行業帶來更加高效、精準的自然語言處理體驗。