京東零售技術團隊宣佈成功推出首個自研的十億級銷量預測時序大模型——TimeHF。該模型基於人類反饋的強化學習技術(RLHF),首次將其應用於銷量預測領域,預測準確度大幅提升10%以上,顯著降低了需求端預測的不確定性。這一成果不僅在京東內部的2萬種商品自動化補貨場景中取得了卓越表現,還在多個公開數據集上超越了行業現有水平,成爲時間序列預測領域的最新標杆。

京東供應鏈算法團隊在技術探索中發現,傳統的時間序列預測方法,如ARIMA、Prophet以及早期的深度學習模型LSTM、TCN等,在面對複雜模式捕捉和零樣本泛化能力方面存在明顯不足。而現有的時序大模型在數據集質量和RLHF方案上也面臨諸多挑戰。爲此,京東團隊從數據集構建、模型設計和訓練方案三個方面進行了創新。

在數據集構建方面,京東團隊整合了京東自營銷量時序數據、公開數據集和合成數據,通過質量過濾、去重、多樣性排序和數據配比等手段,構建了一個包含15億樣本的大規模高質量複雜數據集。這一數據集的規模和質量在時序領域前所未有,爲模型訓練提供了堅實基礎。

微信截圖_20250410085800.png

模型設計上,京東提出了PCTLM(Patch Convolutional Timeseries Large Model)模型。該模型採用基於Patch的方法,通過掩碼編碼器架構對時間序列進行建模,並引入時間位置編碼的分組注意力機制,有效捕捉跨Patch間的信息,提升了模型對複雜時空關聯的捕捉能力。

在訓練方案上,京東首次提出了適用於純時序大模型的強化學習框架TPO(Timeseries Policy Optimization)。該框架針對時序大模型的特點,解決了傳統RLHF框架無法直接應用於時序場景的問題,通過增加預測概率化組件、設計優勢函數和時序損失等創新手段,顯著提升了模型的預測性能。

經過一系列創新,TimeHF在多個公開數據集上取得了SOTA(State of the Art)的效果,相較於當前領先的時序深度學習方法和微調大模型,展現出更強的零樣本性能和預測準確性。目前,該模型已在京東供應鏈系統部署上線,爲2萬個SKU提供自動化補貨預測,預測準確率大幅提升。

京東零售集團供應鏈團隊將於4月19日舉辦線上分享會,詳細解讀TimeHF的技術細節,包括如何構建高質量、多樣化的大規模時間序列數據集以及面向時序大模型的RLHF方案。這一成果不僅爲京東自身的供應鏈管理帶來了革新,也爲整個行業提供了寶貴的技術參考和實踐範例。