基于可中断Option的在线分层强化学习方法

qingyue19709 10 0 PDF 2021-01-16 23:01:02

针对大数据体量大的问题,在Macro-Q算法的基础上提出了一种在线更新的Macro-Q算法(MQIU),同时更新抽象动作的值函数和元动作的值函数,提高了数据样本的利用率。针对传统的马尔可夫过程模型和抽象动作均难于应对可变性,引入中断机制,提出了一种可中断抽象动作的Macro-Q无模型学习算法(IMQ),能在动态环境下学习并改进控制策略。仿真结果验证了MQIU算法能加快算法收敛速度,进而能解决更大规模的问题,同时也验证了IMQ算法能够加快任务的求解,并保持学习性能的稳定性。

用户评论

暂无评论

强化学习火炬源码

深度强化学习火炬该存储库使用pytorch实现了不同的流行的深度强化学习算法。这些旨在用作学习工具,以补充来自以下方面的学习材料: 深度Q学习

7 2021-04-04
强化学习综述.zip

强化学习综述,比较全面,内含详细原理介绍和公式推导

18 2021-04-22
深度强化学习DQN

本文来自于csdn,本文章主要介绍了深度学习与强化学习结合起来从而实现从感知(Perception)到动作( Action)的端对端(End-to-end)学习的一种全新的算法。原因:在普通的Q-l

29 2021-02-01
强化学习实战_强化学习在阿里的技术演进和业务创新

2018年10月出版的实体书版本，一共十四章，不是网上通常下载的12章的电子书。

36 2019-05-01
强化学习在60天内学习深度强化学习Python讲座和代码强化学习加深度学习源码

深度强化学习课程探索神经网络和强化学习的结合。 Python和PyTorch中的算法和示例您是否听说过和的取得了惊人的结果? 这都是关于深度神经网络和强化学习的。您是否想了解更多? 这是您最终学

51 2021-02-16
深度强化学习中的迁移学习

本文综述了迁移学习在强化学习问题设置中的应用。RL已经成为序列决策问题的关键的解决方案。随着RL在各个领域的快速发展。包括机器人技术和游戏,迁移学习是通过利用和迁移外部专业知识来促进学习过程来帮助RL

21 2020-09-21
强化学习Q学习算法的应用

用于强化学习，在机器人大赛中用所应用，希望能给大家带来帮组，表述了强化学习方法Q学习在机器人臂章中的应用

39 2020-03-21
机器学习的强化学习讲义第2章学习强化学习快速上手的学习材料

机器学习的强化学习讲义第3章，学习强化学习快速上手的学习材料

36 2019-02-17
机器学习的强化学习讲义第4章学习强化学习快速上手的学习材料

机器学习的强化学习讲义第4章，学习强化学习快速上手的学习材料

24 2019-02-17
DeepPath我的EMNLP论文DeepPath知识图推理的强化学习方法的代码和文档源码

知识图论的深度强化学习我们研究在大型知识图(KG)中学习推理的问题。更具体地说,我们描述了一种用于学习多跳关系路径的新颖的强化学习框架:我们使用基于知识图嵌入的具有连续状态的基于策略的代理,这通过

4 2021-02-09

基于可中断Option的在线分层强化学习方法

用户评论

推荐下载