基于重抽样优选缓存经验回放机制的深度强化学习方法

boyun84803 8 0 PDF 2021-01-15 15:01:54

针对深度强化学习算法中经验缓存机制构建问题,提出一种基于TD误差的重抽样优选缓存机制;针对该机制存在的训练集坍塌现象,提出基于排行的分层抽样算法进行改进,并结合该机制对已有的几种典型基于DQN的深度强化学习算法进行改进.通过对Open AI Gym平台上Cart Port学习控制问题的仿真实验对比分析表明,优选机制能够提升训练样本的质量,实现对值函数的有效逼近,具有良好的学习效率和泛化性能,收敛速度和训练性能均有明显提升.

用户评论

暂无评论

基于深度强化学习的软件定义卫星姿态控制算法.pdf

基于深度强化学习的软件定义卫星姿态控制算法.pdf

17 2020-08-09
机器学习的强化学习

机器学习的强化学习讲义第3章，学习强化学习快速上手的学习材料

37 2019-02-17
语音识别中的深度学习方法

语音识别是一种重要的人机交互技术，在人们的日常生活中有着广泛的应用。近年来，深度神经网络在语音识别领域的应用，极大地提高了现有语音识别系统的准确率，使语音识别技术得到了更多的应用。但是，环境噪声等因素

37 2019-06-20
强化学习的资料

关于强化学习的讲解，以PPT的形式出现非常条理化，是了解强化学习的好资料。

17 2019-05-19
郑哲东Deep ReID行人重识别的深度学习方法

郑哲东 Deep-ReID:行人重识别的深度学习方法。 Person re-identification Background Learn pedestrian representations fro

6 2020-10-30
迁移学习方法深度学习教学资料

深度解析迁移学习的方方面面，网络，数据，迁移方法，零样本学习，无监督学习

39 2019-02-21
图网络重磅综述基于图的深度学习方法

近十年,深度学习成为人工智能和机器学习这顶皇冠上的明珠,在声学、图像和自然语言处理领域展示了顶尖的性能。深度学习提取数据底层复杂模式的表达能力广受认可。但是,现实世界中普遍存在的图却是个难点,图表示对

22 2021-01-31
基于动态规划的强化学习.md

Dynamic Programming Based Reinforcement Learning Methods Reinforcement Learning Policy Iteration Lea

19 2020-12-06
深度强化学习A2C算法实现

完整实现A2C算法，包括实现要点、模型构建、虚拟环境交互、模型训练、信息监控等，并亲测在googlecolab中运行

32 2020-05-28
深度强化学习斯坦福教学PPT

斯坦福大学对于深度强化学习的教程PPT，包括理论讲解和对应的代码

21 2019-09-09

基于重抽样优选缓存经验回放机制的深度强化学习方法

用户评论

推荐下载