欧博充值:DQN(Deep Q-learning)(入)门教程((零))之教程先容

2020-05-24 22 views 0

扫一扫用手机浏览

{简介}

DQN“入门系列地址”:https://www.cnblogs.com/xiaohuiduan/category/1770037.html

〖原本呢〗,{在上一个系列数据挖掘入门系列博客}中,“ 我[”(是)准备写数据挖掘的教程,〖『然后』不知怎么滴〗,‘博客越写越偏’,「写到了神经网络」,〖深度学习去了〗。“在 我[写完数据挖掘博客之后”, 我[又不知道在那里[(YouTube or B《站杀 我[》)“看到了有人使用”CNN「网络玩飞翔的小鸟」(Flappy Bird){的游戏},<那时 我[以为>,emm,〖竟然使用〗CNN《就可以玩游戏》,【有意思】,<可以一试>,<然>后发现,【要用到】DQN,(再『然后』),『又发现其(是)强化学』习的知识,『然后』,“就入坑了”。

《别人的学习流程(是)《<强化>学习》》——>Q-learning——>DQN——>Fly,“ 我[学习流程”TM(是) Fly——>CNN——>DQN——>Q-learning——>《<强化>学习》

‘固然’,“本教”程照样会根据"《<强化>学习》——>Q-learning——>DQN——>Fly"〖的流程来〗,〖否则反着来谁受得了〗。

《至于为什么教程名叫做》DQN《入门教程》而不(是)《<强化>学习》入门博客,(是)由于该系列侧重点不(是)《<强化>学习》,而(是)DQN。“因此”,一切的目的都(是)朝着DQN〖向前〗。

教程目的[

“该系列博客仍然定位为入门博客”,“因此”不会涉及详细对《<强化>学习》的各个方面都举行先容,《然则不会影响从》【入门到入土】【的连贯性】。‘至于为什么定’位为入门博客:1. 博主自己也(是)刚学,而且也不(是)系统性的学习(‘由于要准备考研’,<没有时间>),以(是)自己的知识面也不够。 2. 〖实际上只要 我[们能够入门〗,知道什么(是)《<强化>学习》,什么(是)DQN,{能够自己写一个}DQN〖的模子〗,『然后』获得效果就了。“至于更深入的内容”,《都入门了》,「还不能够自己修炼吗」?『同样』,这也(是) 我[的学习方法:《先知道能够做什么》,『然后』做出来(并不(是)简朴的copy《代码》,‘照样需要知道为什么这样做’),『然后』再深入的来领会怎么做,(怎么做的更好)。

〖该教程涉及的内容如下〗:

  • 《<强化>学习》{简介}
  • 《马尔科夫决议历程》
  • Q-learing「算法」
  • DQN
  • Nature DQN

<最终会完成>2个【有意思】的小项目:

  1. MountainCar-v0

    「『通』过」DQN『训练』之后,‘小车能够自动移动到’旌旗的地方。

  2. Flappy Bird

    「『通』过」DQN『训练』之后,「小鸟能够自动玩游戏」。

<如果>有任何 问题[, 迎接[mail 我[。

,

sunbet

www.43zhekou.com{在即将到来的}2019〖年〗,《将以更暖心的服务》,『更完善』的技术,{更足够的资金}, 为所有[Sunbet「的代理」、“会员提供更好的开户”、{买分服务}。

Allbet网站内容转载自互联网,如有侵权,联系Allbet删除。

本文链接地址:http://www.zdtfy.com/post/1425.html

相关文章

发表评论