2022

对AC算法的看法:AC->A2C->A3C

Jinyao Liu

简要介绍了Actor-Critic类强化学习算法的发展历程,从传统的策略梯度方法到AC、A2C,再到并发异步的A3C算法,探讨了它们如何逐步优化以提高训练效率和模型性能。