清晰的学习路径

想要入门强化学习，一份优质的课程必不可少。

强化学习资源千千万，项目作者 Denny Britz 大力推荐这两个：

David Silver 的强化学习课程：

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

以及 Richard Sutton 和 Andrew Barto的《强化学习：简介（第二版）》：

http://incompleteideas.net/book/RLbook2018.pdf

p.s. 实测无需魔法

Denny Britz 小哥表示，这两本书几乎涵盖了入门强化学习需要了解的大部分研究论文，基础决定高度，理论知识还是要扎扎实实学起来。

理论有了，可书里并没有算法实现。

别担心，帮人帮到底，送佛送到西，Denny Britz 亲自动手，用 Python，OpenAI Gym 和 Tensorflow 实现了大多数标准强化算法，并把它们都共享了出来，方便大家配合教材食用。

简直太贴心。

在这份万星资源里，每个文件夹都对应着教材的一个或多个章节。除了练习和解决方案之外，每个文件夹下还包含了一系列学习目标，基础概念摘要，以及相关链接。

以基于模型的强化学习：使用动态规划的策略迭代和值迭代这一章为例。

这一章配套的是 David Silver RL课程的第三讲，动态编程规划。

首先是学习目标：

设定好学习目标，这份教程还替你划了重点概念。

最后，奉上实战演练。

大框架已经搭好，只需专注重点思考如何填空：

文后附标准答案：

实现算法列表

这份教程现在涵盖了以下算法实现。

学习路径如此清晰，这样的优质资源，不Mark一下吗？

传送门：

https://github.com/dennybritz/reinforcement-learning