登录
首页 » python » 强化学习教程代码

强化学习教程代码

于 2022-03-15 发布 文件大小:247.06 kB
0 144
下载积分: 2 下载次数: 3

代码说明:

强化学习基本教程,包括A3C,DDPG等 有小车、机器臂等基本游戏的控制 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论


0 个回复

  • 《Python标准库》中文版
    说明:  python标准库,用于学习python的小伙伴(Python standard library)
    2020-06-20 12:20:02下载
    积分:1
  • test
    说明:  通过模拟退火算法解决旅行商问题,能够通过运行(The simulated annealing algorithm is used to solve the traveling salesman problem)
    2020-12-21 11:48:09下载
    积分:1
  • lecture 3-11.py
    美国本科python课堂实用初级入门教学实例(Python introduction teaching example)
    2019-03-05 12:47:58下载
    积分:1
  • Django验证码示例(用于登陆验证)
    Django验证码示例(用于登陆验证)
    2019-05-05下载
    积分:1
  • python
    通过视频文件库dib进行人脸关键点检测,当图片倾斜时,旋转图片为正方向,进行人脸检测,每次旋转的角度为60度,当旋转360度,还是无法检测时,则认为人脸不存在。
    2022-01-30 15:37:25下载
    积分:1
  • wdsjbntmod
    说明:  一个普通的小游戏,没有什么功能,就一个垃圾小游戏(An ordinary little game, no function, just a garbage game.)
    2020-06-19 16:40:01下载
    积分:1
  • BR_SVM
    使用iwr16xx雷达板进行人体摔倒检测(Fall detection, useTI iwr16xx board)
    2019-06-08 20:02:19下载
    积分:1
  • python设计模式第2版
    python设计模式第2版 学习python Python3程序开发指南(python design mode, for python learn.)
    2020-06-22 14:40:01下载
    积分:1
  • KNN al
    python机器学习算法实战里KNN 算法代码。
    2023-09-09 02:15:04下载
    积分:1
  • LSB信息隐藏算法
    该代码是基于Python写的,可基于LSB机制的实现信息隐藏,并可以对隐藏的信息进行提取
    2023-02-26 07:05:03下载
    积分:1
  • 696518资源总数
  • 105417会员总数
  • 32今日下载