论文研究量子神经网络的分布强化学习

zhaoshanhe38922 15 0 PDF 2020-07-17 04:07:30

传统的强化学习（RL）使用回报（也称为累积随机奖励的期望值）来训练代理学习最佳策略。但是，最近的研究表明，学习学习收益的分布要比学习其预期价值具有不同的优势，如在不同的RL任务中所见。从使用传统RL的收益期望到分配RL收益分配的转变，为RL的动力学提供了新见解。本文基于我们最近的研究RL量子方法的工作。我们的工作使用量子神经网络实现了分位数回归（QR）分布Q学习。该量子网络在具有不同分位数的网格世界环境中进行了评估，说明了其对算法学习的详细影响。还将其与马尔可夫决策过程（MDP）链中的标准量子Q学习进行了比较，这表明量子QR分布Q学习比标准量子Q学习可以更有效地探索环境。 RL中的

资源预览

用户评论

暂无评论

强化学习PPT

第九章的技术文档可供参考。

1 2024-05-03
论文研究分布式环境下卷积神经网络并行策略研究.pdf

卷积神经网络通常使用标准误差逆传播算法进行串行训练，随着数据规模的增长，单机串行训练存在耗时长且占有较多的系统资源的问题。为有效实现海量数据的卷积神经网络训练，提出一种基于MapReduce框架的BP

20 2020-07-19
论文研究基于深度强化学习的动态计算卸载.pdf

基于深度强化学习的动态计算卸载，程百川，刘丹谱，移动边缘计算在移动网络边缘提供计算资源。为了减少执行时延，计算密集型任务可以从用户设备卸载到移动边缘服务器。当考虑到任务

19 2020-04-26
论文研究异质Agent间的知识迁移强化学习.pdf

异质Agent间的知识迁移强化学习，刘博，程玉虎，针对现有知识迁移方法仅适用于同质强化学习Agent的问题，提出一种能够在具有不同状态动作空间的异质Agent间迁移知识的Q学习算法。算�

37 2019-09-09
论文研究基于蚂蚁优化算法的分层强化学习.pdf

自主系统中，agent通过与环境交互来执行分配给他们的任务，采用分层强化学习技术有助于agent在大型、复杂的环境中提高学习效率。提出一种新方法，利用蚂蚁系统优化算法来识别分层边界发现子目标状态，蚂蚁

28 2020-07-17
神经网络很好的学习matlab编程以及理解神经网络

神经网络,基于matlab的,对人脸库进行训练,可用于人脸识别

10 2021-01-10
deep reinforcement learning networks一种用于强化学习任务的深层神经网络结构.zip

deep-reinforcement-learning-networks, 一种用于强化学习任务的深层神经网络结构深层强化学习网络一种用于强化学习任务的深层神经网络结构。纸域模型架构源代码Mnih等

17 2020-08-22
ChatGPT背后强化学习与深度强化学习的技术详解

ChatGPT背后强化学习与深度强化学习的技术详解

5 2023-06-29
强化学习简介介绍强化学习的应用及理论.pptx

强化学习简介——介绍强化学习的应用及理论包含视频

22 2020-08-09
强化haskell中的强化学习源码

强化:haskell中的强化学习

12 2021-02-25

论文研究 量子神经网络的分布强化学习

资源预览

用户评论

推荐下载

论文研究量子神经网络的分布强化学习