華納兄弟探索公司(WBD)是一家全球領先的媒體與娛樂公司,擁有豐富的內容組合,涵蓋電視、電影和流媒體等多個領域。隨着用戶對個性化內容的需求不斷增加,該公司決定通過改進其人工智能和機器學習(AI/ML)推理基礎設施來提升用戶體驗。在這一過程中,他們採用了 AWS Graviton 處理器和 Amazon SageMaker AI 實例,取得了顯著的成本節約和性能提升。

WBD 在全球範圍內擁有超過1.25億用戶,其個性化推薦系統需要在實時環境中進行高效運行。爲了應對日益增長的用戶需求和成本壓力,該公司在 AWS 的支持下,開始了向 Graviton 實例遷移的工作。通過這種方式,WBD 不僅降低了基礎設施的成本,還提升了推理的速度,平均節約達60%。在某些情況下,特別是在目錄排名模型中,成本甚至降低了88%。
在推理速度方面,WBD 也取得了顯著的成效。通過優化後的基礎設施,P99延遲在不同模型中減少了7% 到60% 不等,XGBoost 模型的延遲減少幅度達到了60%。這種性能提升使得用戶能夠體驗到更快速、更精準的內容推薦,從而增強了用戶的參與度和粘性。
WBD 的遷移過程非常順利,從初步測試到最終全面部署,僅用了一月時間。公司計劃繼續將更多的推薦系統遷移至 Graviton 實例,以進一步提高運營效率和降低成本。
劃重點:
🌟 實現60% 的成本節約:WBD 通過遷移至 AWS Graviton 實例,顯著降低了其個性化推薦系統的運營成本。
⚡ 推理速度提升:不同模型的 P99延遲減少了7% 到60%,爲用戶提供了更快速的內容推薦。
🔧 順利的遷移過程:從初步測試到全面部署,僅用一個月的時間,確保了項目的高效執行。
