基于重抽样优选缓存经验回放机制的深度强化学习方法
针对深度强化学习算法中经验缓存机制构建问题,提出一种基于TD误差的重抽样优选缓存机制;针对该机制存在的训练集坍塌现象,提出基于排行的分层抽样算法进行改进,并结合该机制对已有的几种典型基于DQN的深度强化学习算法进行改进.通过对Open AI Gym平台上Cart Port学习控制问题的仿真实验对比分析表明,优选机制能够提升训练样本的质量,实现对值函数的有效逼近,具有良好的学习效率和泛化性能,收敛速度和训练性能均有明显提升.
用户评论
推荐下载
-
基于深度强化学习的软件定义卫星姿态控制算法.pdf
基于深度强化学习的软件定义卫星姿态控制算法.pdf
17 2020-08-09 -
机器学习的强化学习
机器学习的强化学习讲义第3章,学习强化学习快速上手的学习材料
37 2019-02-17 -
语音识别中的深度学习方法
语音识别是一种重要的人机交互技术,在人们的日常生活中有着广泛的应用。近年来,深度神经网络在语音识别领域的应用,极大地提高了现有语音识别系统的准确率,使语音识别技术得到了更多的应用。但是,环境噪声等因素
37 2019-06-20 -
强化学习的资料
关于强化学习的讲解,以PPT的形式出现非常条理化,是了解强化学习的好资料。
17 2019-05-19 -
郑哲东Deep ReID行人重识别的深度学习方法
郑哲东 Deep-ReID:行人重识别的深度学习方法。 Person re-identification Background Learn pedestrian representations fro
6 2020-10-30 -
迁移学习方法深度学习教学资料
深度解析迁移学习的方方面面,网络,数据,迁移方法,零样本学习,无监督学习
39 2019-02-21 -
图网络重磅综述基于图的深度学习方法
近十年,深度学习成为人工智能和机器学习这顶皇冠上的明珠,在声学、图像和自然语言处理领域展示了顶尖的性能。深度学习提取数据底层复杂模式的表达能力广受认可。但是,现实世界中普遍存在的图却是个难点,图表示对
22 2021-01-31 -
基于动态规划的强化学习.md
Dynamic Programming Based Reinforcement Learning Methods Reinforcement Learning Policy Iteration Lea
19 2020-12-06 -
深度强化学习A2C算法实现
完整实现A2C算法,包括实现要点、模型构建、虚拟环境交互、模型训练、信息监控等,并亲测在googlecolab中运行
32 2020-05-28 -
深度强化学习斯坦福教学PPT
斯坦福大学对于深度强化学习的教程PPT,包括理论讲解和对应的代码
21 2019-09-09
暂无评论