参数相关任务中Option算法的子任务重用

jjhisoka 5 0 PDF 2020-08-20 01:08:34

将分层强化学习算法中的子任务应用于同类学习任务中是当前强化学习的一个研究热点。在控制系统中,分层强化学习算法存在着子任务受系统参数影响而难以重用的问题。针对这一问题,文章提出基于定性动作的分层Option算法。算法用定性动作描述在参数值不同的系统中,系统同一状态的最优动作所具有的共同特征。同时建立分层子任务,用低层子任务屏蔽系统参数对高层子任务的影响,文中提出的算法用于倒立摆的控制中,算法利用学好的高层子任务仅需要进行少量的学习即可成功控制各种参数值不同的倒立摆系统。

用户评论

暂无评论

灵巧卫星任务规划模型及算法

灵巧卫星任务规划模型及算法

9 2021-02-22
计算网格中独立任务批模式调度映射算法研究

典型的独立任务映射与调度算法包括：快速贪吃算法（Fast-Greedy）,贪吃算法（Greedy），极小-极小算法（Min-Min）,极大-极小算法（Max-Min）,忍耐算法和老化算法等

35 2019-01-08
修复任务栏不能显示任务的问题

修复任务栏不能显示任务的问题操作很简单下载后直接双击后就可以修复

42 2019-02-18
任务栏不显示任务的解决方法

我是刚好碰到这个问题然后网上找解决方法最后确定这个方法是可行的，且容易操作，所以提出来与大家共享啦。

30 2019-04-19
并行测试系统的任务分解和任务过程模型

针对并行测试系统中的提高测试任务并行性问题，通过对并行测试目标系统和被测对象问题域的特点分析，提出测试任务分解的原则和方法，对分解后的子任务构造任务相关图，并通过任务过程模型算法把任务相关图转化为

57 2018-12-25
任务将在Github上跟踪PhET的常规任务源码

任务 PhET的常规任务将在GitHub上进行跟踪

14 2021-02-27
本雅明译者的任务

本雅明:译者的任务张旭东译在欣赏艺术作品或艺术形式的过程中,观赏者的因素从未带给人什么收获。谈论什么公众或其代表人物在此只能使人误入歧途,甚至连“理想的”接受者这个概念在探讨艺术时也有害无

12 2021-01-31
简单的任务系统

简单的php与mysql交互，方便纪录每天的任务以及完成程度

26 2019-03-05
创新者的任务

创新者的任务，克莱顿克里斯坦森的新作

24 2019-05-14
异步任务的Demo

AsyncTask异步任务Demo

34 2019-05-13

参数相关任务中Option算法的子任务重用

用户评论

推荐下载