登录
首页 » python » 强化学习教程代码

强化学习教程代码

于 2022-03-15 发布 文件大小:247.06 kB
0 141
下载积分: 2 下载次数: 3

代码说明:

强化学习基本教程,包括A3C,DDPG等 有小车、机器臂等基本游戏的控制 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论


0 个回复

  • autocoder
    说明:  自编码的训练模型,数据太大我将正在之后上传,希望可以帮到需要的朋友(Self coded training model, the data is too large, I will upload it later, hoping to help friends who need it)
    2020-01-19 18:29:04下载
    积分:1
  • TSVM code
    TSVM源码压缩包,用于数据分类处理,数据分析必备,科研神器,多目标半监督学习,特征提取,支持向量机源码
    2022-05-19 05:31:41下载
    积分:1
  • mx-maskrcnn-master
    说明:  我们提出了一个简单、灵活和通用的对象实例分割框架。我们的方法能有效检测图像中的对象,同时为每个实例生成高质量的 segmentation mask。这种被称为 Mask R-CNN 的方法通过添加用于预测 object mask 的分支来扩展 Faster R-CNN,该分支与用于边界框识别的现有分支并行。Mask R-CNN 训练简单,只需在以 5fps 运行的 Faster R-CNN 之上增加一个较小的 overhead。此外,Mask R-CNN 很容易推广到其他任务,例如它可以允许同一个框架中进行姿态估计。我们在 COCO 系列挑战的三个轨道任务中均取得了最佳成果,包括实例分割、边界对象检测和人关键点检测。没有任何 tricks,Mask R-CNN 的表现优于所有现有的单一模型取得的成绩,包括 COCO 2016 挑战赛的冠军。(Mask R-CNN code by HeKaiming)
    2020-06-17 15:20:12下载
    积分:1
  • 男声女声识别程序
    k男声女声识别程序,识别出男性和女性声音,通过样本学习和对比,可以识别比较准确,是比较方不的一个工具
    2023-02-10 10:00:03下载
    积分:1
  • 最佳抓取网站
    这是一个用于教育目的的样例Scrapy项目。
    2022-03-04 03:03:05下载
    积分:1
  • deep_q_network
    说明:  Python环境下 愤怒的小鸟 强化学习程序完整版,Qlearning 算法(The full version of Angry Birds Reinforcement Learning Program in Python Environment, Qlearning Algorithm)
    2020-06-02 08:29:03下载
    积分:1
  • movie
    python爬虫代码,获取豆瓣电影名及其评分。(Python crawler code, get the movie name and its score.)
    2018-08-23 16:38:37下载
    积分:1
  • underwater_doa-master
    说明:  基于DOA的水声网络目标定位方法,首先利用MUSIC算法进行测向,再利用最小二乘法进行融合以定位。(DOA based underwater acoustic network target location method, first use music algorithm for direction finding, then use least square method for fusion to locate.)
    2020-01-14 15:22:00下载
    积分:1
  • 以slam为核心的python实现代码SLAM
    以slam为核心的python实现代码,包含可视化组件(some slam code with the python script)
    2021-01-03 13:38:57下载
    积分:1
  • calculator
    说明:  使用python实现计算器,基本实现计算器所需要的全部功能,非常适合用来测试(operator, Out-of-Sample Equity Premium Prediction: Combination Forecasts and Links to the Real Economy)
    2019-12-22 21:19:14下载
    积分:1
  • 696518资源总数
  • 105193会员总数
  • 18今日下载