基于可中断Option的在线分层强化学习方法
针对大数据体量大的问题,在Macro-Q算法的基础上提出了一种在线更新的Macro-Q算法(MQIU),同时更新抽象动作的值函数和元动作的值函数,提高了数据样本的利用率。针对传统的马尔可夫过程模型和抽象动作均难于应对可变性,引入中断机制,提出了一种可中断抽象动作的Macro-Q无模型学习算法(IMQ),能在动态环境下学习并改进控制策略。仿真结果验证了MQIU算法能加快算法收敛速度,进而能解决更大规模的问题,同时也验证了IMQ算法能够加快任务的求解,并保持学习性能的稳定性。
用户评论
推荐下载
-
强化学习火炬源码
深度强化学习火炬 该存储库使用pytorch实现了不同的流行的深度强化学习算法。 这些旨在用作学习工具,以补充来自以下方面的学习材料: 深度Q学习
7 2021-04-04 -
强化学习综述.zip
强化学习综述,比较全面,内含详细原理介绍和公式推导
18 2021-04-22 -
深度强化学习DQN
本文来自于csdn,本文章主要介绍了深度学习与强化学习结合起来从而实现从感知(Perception)到动作( Action)的端对端(End-to-end)学习的一种全新的算法。 原因:在普通的Q-l
29 2021-02-01 -
强化学习实战_强化学习在阿里的技术演进和业务创新
2018年10月出版的实体书版本,一共十四章,不是网上通常下载的12章的电子书。
36 2019-05-01 -
强化学习在60天内学习深度强化学习Python讲座和代码强化学习加深度学习源码
深度强化学习课程 探索神经网络和强化学习的结合。 Python和PyTorch中的算法和示例 您是否听说过和的取得了惊人的结果? 这都是关于深度神经网络和强化学习的。 您是否想了解更多? 这是您最终学
51 2021-02-16 -
深度强化学习中的迁移学习
本文综述了迁移学习在强化学习问题设置中的应用。RL已经成为序列决策问题的关键的解决方案。随着RL在各个领域的快速发展。包括机器人技术和游戏,迁移学习是通过利用和迁移外部专业知识来促进学习过程来帮助RL
21 2020-09-21 -
强化学习Q学习算法的应用
用于强化学习,在机器人大赛中用所应用,希望能给大家带来帮组,表述了强化学习方法Q学习在机器人臂章中的应用
39 2020-03-21 -
机器学习的强化学习讲义第2章学习强化学习快速上手的学习材料
机器学习的强化学习讲义第3章,学习强化学习快速上手的学习材料
36 2019-02-17 -
机器学习的强化学习讲义第4章学习强化学习快速上手的学习材料
机器学习的强化学习讲义第4章,学习强化学习快速上手的学习材料
24 2019-02-17 -
DeepPath我的EMNLP论文DeepPath知识图推理的强化学习方法的代码和文档源码
知识图论的深度强化学习 我们研究在大型知识图(KG)中学习推理的问题。 更具体地说,我们描述了一种用于学习多跳关系路径的新颖的强化学习框架:我们使用基于知识图嵌入的具有连续状态的基于策略的代理,这通过
4 2021-02-09
暂无评论