DeepMind 的研究人員通過實現離線強化學習,推出了 AlphaStar Unplugged,成功解決了星際爭霸 II 的挑戰。通過建立離線 RL 基準,他們展示了大規模離線強化學習的潛力,併爲複雜環境下的代理訓練提供了更實際的方法。這一成果有望推動離線強化學習研究取得更大進展。