【技术创作101训练营】从强化学习到学界前沿DQN,你需要了解这些

强化学习到DQNv1.pptx

大家好,我是大鹅,本次演讲会介绍强化学习RL的基础知识,基本方法,以及如何推导到DQN,和关于DeepMind的Playing Atari with Deep Reinforcement Learning(DQN学习打砖块游戏)这篇论文的一些理解,后续改进方向,还有一些具体实现。

演讲大纲:

  1. 强化学习基础
  2. MDP马尔科夫决策过程
  3. Value Function 价值函数
  4. Bellman方程
  5. Action-value Function 动作价值函数
  6. Optimal Value Function 最优价值函数
  7. Q-learning
  8. DQN
  9. 后续的Improvement方向
  10. 参考文献

(演讲内容主要是公式推导的与算法介绍,PPT里都有)

Ref

http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html (David Silver的课程PPT)

https://zhuanlan.zhihu.com/p/21547911

http://www.cnblogs.com/wangxiaocvpr/p/5601972.html

http://www.cnblogs.com/jinxulin/p/3526542.html

http://blog.csdn.net/buyulian/article/details/79209338

DeepMind, Playing Atari with Deep Reinforcement Learning,2013

周志华,机器学习西瓜书

本站文章资源均来源自网络,除非特别声明,否则均不代表站方观点,并仅供查阅,不作为任何参考依据!
如有侵权请及时跟我们联系,本站将及时删除!
如遇版权问题,请查看 本站版权声明
THE END
分享
二维码
海报
【技术创作101训练营】从强化学习到学界前沿DQN,你需要了解这些
大家好,我是大鹅,本次演讲会介绍强化学习RL的基础知识,基本方法,以及如何推导到DQN,和关于DeepMind的Playing Atari with Deep ...
<<上一篇
下一篇>>