登录
首页 » python » 强化学习教程代码

强化学习教程代码

于 2022-03-15 发布 文件大小:247.06 kB
0 179
下载积分: 2 下载次数: 3

代码说明:

强化学习基本教程,包括A3C,DDPG等 有小车、机器臂等基本游戏的控制 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • fama
    用python写的实测fama模型学习思路以及开发案例源代码(Python-based learning idea of measured Fama model and source code of development case)
    2020-06-16 11:20:02下载
    积分:1
  • 编程流量老师团队官网培训python基础代码分享
    编程流量老师团队官网培训python基础代码分(Python Basic Code Sharing in Programming Traffic Team Official Website Training)
    2018-12-12 16:04:36下载
    积分:1
  • 简易网页搭建实例
    利用Python技术搭建一个简易网页实例,附有整个项目的完整资料。(Use Python technology to build a simple web page example, with complete information of the whole project.)
    2017-12-17 22:21:15下载
    积分:1
  • tensorflow的简单实例
    学习tensorflow的简单入门工具,对于初学者具有重要的作用,希望能够帮到真正需要学习的初学者~,代码中包含了线性递归模型、逻辑递归、卷积神经网络、多GPU并行计算等工具,本人受益良多,特此分享,忘共同进步
    2022-02-22 04:20:34下载
    积分:1
  • mnist识别
    说明:  利用卷积神经网络及神经网络识别手写数字,准确率95以上。(Using convolution neural network and neural network to recognize handwritten digits, the accuracy is over 95.)
    2019-03-19 15:29:06下载
    积分:1
  • selenium自动化百度联想词
    selenium+PYHTON环境的自动化,模仿百度联想词编写的代码,方便大家使用
    2022-12-28 18:35:03下载
    积分:1
  • spider-(2)
    应用python编写的百度指数新闻爬取代码(baiduindex spider)
    2017-03-15 21:45:43下载
    积分:1
  • cnn-compression-master
    说明:  compression压缩感知算法用于图像处理。信号压缩(compressionCompressed sensing algorithm)
    2020-12-08 19:59:21下载
    积分:1
  • theTippingProblem
    模糊控制示例程序,以小费问题为例。采用scikit lib,有详细注释,适合初学者。(Solving the tipping problem by fuzzy control system.)
    2017-12-03 22:10:49下载
    积分:1
  • databricks-spark-reference-applications.pdf.tar
    摘要: 现有的聚类算法比如 CluStream 是基于 k-means 算法的。这些算法不能够发现任 意形状的簇以及不能处理离群点。 解决上述问题,本文提出了 而且, 它需要预先知道 k 值和用户指定的时间窗口。 为了 分将数据映射到一个网格, D-Stream 算法,它是基于密度的算法。这个算法用一个在线部 在离线部分计算网格的密度然后基于密度形成簇。 度衰减技术来捕获数据流的动态变化。 为了探索衰减因子、 数据密度以及簇结构之间的关系, 我们的算法能够有效的并且有效率地实时调整簇。 群点的稀疏网格是合理的, 算法采用了密 而且, 我们用理论证明了移除那些属于离 从而提高了系统的时间和空间效率。 该技术能聚类高速的数据流 而不损失聚类质量。 实验结果表明我们的算法在聚类质量和效率是有独特的优势, 并且能够 发现任意形状的簇,以及能准确地识别实时数据流的演化行为(Abstract: Existing clustering algorithms such as CluStream are based on the k-means algorithm. These algorithms can not be found Meaningful clusters and can not handle outliers. To solve the above problems, this paper presents)
    2017-09-03 11:05:23下载
    积分:1
  • 696518资源总数
  • 106265会员总数
  • 10今日下载