强化学习算法教程.pdf

qxb903128579 43 0 7Z 2019-07-10 01:07:19

深度强化学习是人工智能领域的一个新的研究热点．它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合，并能够通过端对端的学习方式实现从原始输入到输出的直接控制．自提出以来，在许多需要感知高维度原始输入数据和决策控制的任务中，深度强化学习方法已经取得了实质性的突破．该文首先阐述了3类主要的深度强化学习方法，包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习；其次对深度强化学习领域的一些前沿研究方向进行了综述，包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等．最后总结了深度强化学习在若干领域的成功应用和未来发展趋势。

用户评论

暂无评论

强化学习综述.zip

强化学习综述,比较全面,内含详细原理介绍和公式推导

18 2021-04-22
强化学习火炬源码

深度强化学习火炬该存储库使用pytorch实现了不同的流行的深度强化学习算法。这些旨在用作学习工具,以补充来自以下方面的学习材料: 深度Q学习

7 2021-04-04
强化学习在60天内学习深度强化学习Python讲座和代码强化学习加深度学习源码

深度强化学习课程探索神经网络和强化学习的结合。 Python和PyTorch中的算法和示例您是否听说过和的取得了惊人的结果? 这都是关于深度神经网络和强化学习的。您是否想了解更多? 这是您最终学

51 2021-02-16
基于强化学习的服务链映射算法

提出基于人工智能技术的多智能体服务链资源调度架构,设计一种基于强化学习的服务链映射算法。通过Q-learning的机制,根据系统状态、执行部署动作后的奖惩反馈来决定服务链中各虚拟网元的部署位置。实验结

10 2021-01-16
Matlab强化学习_网格迷宫问题_SarsaLambda算法

MATLAB强化学习代码包，用于解决多步决策模型（网格迷宫问题）的Sarsa-λ算法 "IthoughtwhatI'ddowasI'dpretendIwasoneofthosedeaf-mutes,

18 2020-06-07
深度强化学习A2C算法实现

完整实现A2C算法，包括实现要点、模型构建、虚拟环境交互、模型训练、信息监控等，并亲测在googlecolab中运行

32 2020-05-28
强化学习qlearning算法训练贪吃蛇

利用qlearing算法训练贪吃蛇,模型在2000次循环内取得很好的效果,属于伯克利人工智能导论课cs188中的作业

33 2020-08-16
李宏毅强化学习ppo算法ppt

李宏毅强化学习ppo算法ppt

29 2019-07-06
深度强化学习的调度策略优化算法

Scheduling strategy optimization algorithm for deep reinforcement learning

53 2019-06-23
深入强化学习算法：代码实现与解析

深入强化学习算法：代码实现与解析本项目通过代码实例，剖析经典强化学习算法的内部机制，涵盖：SARSA：基于时间差分学习，直接从智能体与环境的交互中学习。Q-learning：使用最优价值函数估

1 2024-05-08

强化学习算法教程.pdf

用户评论

推荐下载