Hi, 大家好,今天给大家介绍一篇深度强化学习的开山之作,视频中介绍了深度强化学习的模型推理过程和训练过程。其中训练过程包含了详细的TD算法的训练过程,作者使用的神经网络架构等。
现在看来架构等设计还是略显简单,但毕竟我们已经处于2021年,这已经是8年前的作品,但不失它的经典之处。如果你是入门强化学习不懂得强化学习的思想,可以参考视频学习一下。
下面我列出一些强化学习的资料供大家观看,强烈推荐莫凡和ShusenWang的强化学习视频,对我也有很大的启发:
莫凡: / morvanzhou
ShusenWang: / wsszju
最后欢迎大家订阅,不定期更新最新的和经典的paper,一起分享知识。