论文研究连续空间的递归最小二乘行动者—评论家算法.pdf

Xieminsen 7 0 .PDF 2020-07-21 04:07:12

传统的行动者—评论家（actor-critic，AC）算法用在连续空间时，数据利用率低、收敛慢，而现实世界中采样往往需要昂贵的代价，因此提出了一种新的连续空间递归最小二乘AC算法，能够充分利用数据，提高学习预测能力。该方法用高斯径向基函数对连续的状态空间进行编码，评论家部分改用带资格迹的递归最小二乘时间差分方法，而行动者部分用策略梯度方法，在连续动作空间中进行策略搜索。Mountain Car问题的仿真结果表明该算法具有较好的收敛结果。

资源预览

用户评论

暂无评论

matlab开发RBFnetworks的正交最小二乘算法

matlab开发-RBFnetworks的正交最小二乘算法。该代码实现了func近似的OLS算法。

16 2020-07-21
最小二乘滤波算法正弦波

本代码是基于matlab开发的，利用最小二乘法对信号进行鉴别相位差，精度高，抗干扰性强

12 2020-07-17
过程辨识最小二乘算法Matlab程序

包括ＭＬＳ，ＲＣＬＳ，ＲＥＬＳ，ＲＦＦ，ＲＦＭ，ＲＧＬＳ，ＲＩＶ，ＲＬＳ，一次递推等算法

21 2020-05-19
matlab系统辨识最小二乘整批算法

在matlab环境下，运用最小二乘整批算法对系统参数进行辨识，得到脉冲响应，通过改变燥信比可以观察噪声对辨识结果的影响。

24 2019-05-19
限定记忆最小二乘递推算法

限定记忆最小二乘递推算法，参考文献：过程辨识，清华大学出版社，方崇智

59 2019-05-14
最小二乘算法c语言源代码

实现了最小二乘算法，用c语言编写的源代码，

25 2019-07-18
RELS增广最小二乘递推算法

增广最小二乘的递推算法对应的噪声模型为滑动平均噪声，扩充了参数向量和数据向量H（k）的维数，把噪声模型的辨识同时考虑进去。最小二乘法只能获得过程模型的参数估计，而增广最小二乘法同时又能获得噪声模型的参

27 2019-05-04
遗传算法_偏最小二乘回归

数据集必须是o，x+1矩阵，其中每一行是一个对象，列1：x是X变量，最后一列是Y变量。默认值为：种群大小：30条染色体；平均每个原始染色体的5个变量；5个缺失组；在同一染色体中选择的最大变量数：30；

35 2019-05-12
图形学_最小二乘能量算法

曲线光顺算法，基于最小二乘法的自动光顺算法，硕士生论文，图书馆下载的。

21 2018-12-25
精确最小二乘相位解包裹算法

路径无关算法是一类重要的相位解包裹算法,其中最常用的是各种最小二乘算法。由于最小二乘算法无法限制误差在空间中传播,因此不能直接获得精确的解包裹相位,其应用受到了限制。分析最小二乘相位解包裹算法误差的特

14 2021-02-25

论文研究 连续空间的递归最小二乘行动者—评论家算法.pdf

资源预览

用户评论

推荐下载

论文研究连续空间的递归最小二乘行动者—评论家算法.pdf