华纳兄弟探索公司(WBD)是一家全球领先的媒体与娱乐公司,拥有丰富的内容组合,涵盖电视、电影和流媒体等多个领域。随着用户对个性化内容的需求不断增加,该公司决定通过改进其人工智能和机器学习(AI/ML)推理基础设施来提升用户体验。在这一过程中,他们采用了 AWS Graviton 处理器和 Amazon SageMaker AI 实例,取得了显著的成本节约和性能提升。

WBD 在全球范围内拥有超过1.25亿用户,其个性化推荐系统需要在实时环境中进行高效运行。为了应对日益增长的用户需求和成本压力,该公司在 AWS 的支持下,开始了向 Graviton 实例迁移的工作。通过这种方式,WBD 不仅降低了基础设施的成本,还提升了推理的速度,平均节约达60%。在某些情况下,特别是在目录排名模型中,成本甚至降低了88%。
在推理速度方面,WBD 也取得了显著的成效。通过优化后的基础设施,P99延迟在不同模型中减少了7% 到60% 不等,XGBoost 模型的延迟减少幅度达到了60%。这种性能提升使得用户能够体验到更快速、更精准的内容推荐,从而增强了用户的参与度和粘性。
WBD 的迁移过程非常顺利,从初步测试到最终全面部署,仅用了一月时间。公司计划继续将更多的推荐系统迁移至 Graviton 实例,以进一步提高运营效率和降低成本。
划重点:
🌟 实现60% 的成本节约:WBD 通过迁移至 AWS Graviton 实例,显著降低了其个性化推荐系统的运营成本。
⚡ 推理速度提升:不同模型的 P99延迟减少了7% 到60%,为用户提供了更快速的内容推荐。
🔧 顺利的迁移过程:从初步测试到全面部署,仅用一个月的时间,确保了项目的高效执行。
