一类非线性动态系统基于强化学习的最优控制制

tiancantudoutian 10 0 PDF 2021-01-16 17:01:01

提出一类非线性不确定动态系统基于强化学习的最优控制方法. 该方法利用欧拉强化学习算法估计对象的未知非线性函数, 给出了强化学习中回报函数和策略函数迭代的在线学习规则. 通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化, 实现了对值函数的估计和控制策略的改进. 基于值函数的梯度值和时序误差指标值, 给出了该算法的步骤和误差估计定理. 小车爬山问题的仿真结果表明了所提出方法的有效性.

用户评论

暂无评论

非线性最优控制在交叉口协调控制中运用

本文首先介绍了的交叉口动态模型及其收敛条件，并采用了在线预报最优控制方法进行求解，其后介绍实际中求解最优化问题的几种常用算法，并进行综合比较。

21 2019-07-07
一类未知死区的随机非线性系统的自适应神经跟踪控制

一类未知死区的随机非线性系统的自适应神经跟踪控制

7 2021-04-23
一类具有非线性的MIMO离散时间系统的复合分层抗干扰控制

一类具有非线性的MIMO离散时间系统的复合分层抗干扰控制

12 2021-04-07
线性二次型最优控制

从最基本开始讲的线性最优控制，通俗易懂，自己看了之后感觉不错，给大家分享一下！

21 2019-05-15
一类随机非线性系统基于降阶观测器的反步跟踪控制

一类随机非线性系统基于降阶观测器的反步跟踪控制

21 2021-04-07
使用非线性参数化模糊逼近器的一类未知非线性时滞系统的自适应跟踪控制

使用非线性参数化模糊逼近器的一类未知非线性时滞系统的自适应跟踪控制

5 2021-04-25
解一类弱间断最优控制问题的一个自适应拟谱方法

针对弱间断最优控制问题,提出一种自适应拟谱方法.利用一些点序列分割时间区间为若干子区间;控制和状态函数使用分段连续多项式逼近;以数值解的收敛性为基础,证明分割时间区间的点序列可以收敛到弱间断点;依据柯

6 2021-01-17
基于UKF和神经网络的一类非线性系统状态估计

在模型未知的情况下, 估计过程的重要变量尤为重要. 鉴于此, 采用不敏卡尔曼滤波(UKF) 与神经网络相结合的方法, 解决一类未知模型非线性系统的状态估计问题. 采用动态神经网络对非线性系统进行建模,

1 2021-01-17
论文研究基于线性分离的一类具有多扇区非线性输入的混沌系统的滑模控制.pdf

基于线性分离的一类具有多扇区非线性输入的混沌系统的滑模控制，王兴元，牛玉军，研究了一类具有多扇区非线性输入的不确定连续混沌系统的滑模控制问题。基于线性分离技术和滑模控制相结合的方法，设计了滑模控制

26 2019-10-14
一类非线性状态时滞系统的基于采样控制器的渐近稳定问题

针对一类含有状态时滞的非线性系统,利用采样控制方法研究其渐近稳定问题.解决这一问题的关键在于对系统时滞的处理,以及对由于采样方法而产生的状态增长误差进行估计.由于所考虑的时滞是常时滞,可以利用分割方法

4 2021-01-17

一类非线性动态系统基于强化学习的最优控制制

用户评论

推荐下载