增强型深度确定策略梯度算法

tonydin 20 0 PDF 2021-01-16 22:01:24

针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该算法在深度确定策略梯度算法的基础上,重新构建两个新的样本池——多样性样本池和高误差样本池。在算法执行过程中,训练样本分别从多样性样本池和高误差样本池按比例选取,以兼顾样本多样性以及样本价值信息,提高样本的利用效率和算法的收敛性能。此外,进一步从理论上证明了利用自模拟度量方法对样本进行相似性度量的合理性,建立值函数与样本相似性之间的关系。将E-DDPG算法以及DDPG算法用于经典的Pendulum问题和MountainCar问题,实验结果表明,E-DDPG具有更好的收敛稳定性,同时具有更快的收敛速

用户评论

暂无评论

Python ARS一个增强型随机搜索算法的实现

ARS 一个增强型随机搜索算法的实现

8 2020-07-18
增强型微粒群优化算法及其在软测量中的应用

对微粒群优化算法(PSO ) 进行分析, 提出一种增强型微粒群优化算法(EPSO ). 用EPSO 和PSO 对几种常用函数的优化问题进行测试比较, 结果表明EPSO 比PSO 更容易找到全局最优解

9 2021-02-21
增强型数据通道想要增强RTCDataChannel的常规用法源码

增强数据通道 enhance(RTCDataChannel)函数可用于一般用途。安装 npm i enhanced-datachannel 您需要使用webpack , rollup等将其捆绑到您的

12 2021-03-18
增强型命令行工具cmder.zip

Cmder是一个增强型命令行工具,不仅可以使用Widows下的所有命令,并且还可以使用linux和shell命令。

12 2020-12-31
delhpi下的增强型内存管理包fastMM

替换delphi的内存管理库borlandmm.dll,加快delphi IDE启动速度。在代码中引用fastMM库,替换borland的内存管理库,让程序更高效地使用内存,并自动检测内存泄漏。

3 2020-09-19
易语言源码增强型记事本.rar

易语言源码增强型记事本.rar

6 2020-06-19
Ramtron推出增强型处理器外围芯片

针对价格敏感的消费电子市场量身度做全新单芯片解决方案在微型封装中提供增强型RTC(实时时钟)功能 Ramtron International 公司宣布:推出64Kb、3V 内嵌铁

4 2020-11-29
iFIX增强型故障切换与LAN冗余配置

iFIX增强型故障切换与LAN冗余配置：如果您拥有混合网络，且已启动局域网冗余，例如：一个 iClient 配置有单个网卡，另一个 iClient 配置有两个网卡，确定您已在 HOSTS 文件中正确设

24 2019-01-12
增强型进度条控件类CProgressCtrlXVC源码

MFC增强型进度条类，功能齐全，类型丰富，应用非常简单

41 2019-01-21
nmoo与LambdaMOO相似的增强型MOO源码

nmoo:与LambdaMOO相似的增强型MOO

4 2021-02-07

增强型深度确定策略梯度算法

用户评论

推荐下载