强化学习算法研究

Waiting 54 0 pdf 2019-03-15 02:03:42

针对智能Agent运动中，普遍存在的避障问题，结合试错和环境交互，得出策略。

用户评论

tcchjh 2019-03-15 02:03:42

一篇文章，比较贵，对算法的一种研究，

深度强化学习A2C算法实现

完整实现A2C算法，包括实现要点、模型构建、虚拟环境交互、模型训练、信息监控等，并亲测在googlecolab中运行

32 2020-05-28
交互深度强化学习算法的实现源码

相互作用 Interact包含几种深度强化学习算法的实现。安装可以按以下方式安装Interact: git clone https://github.com/rystrauss/interact

31 2021-03-12
huskarl深度强化学习框架加算法源码

胡斯卡尔 Huskarl是专注于模块化和快速原型设计的深度强化学习框架。它基于TensorFlow 2.0构建,并在可能的情况下使用tf.keras API以获得简洁性和可读性。 Huskarl使跨

19 2021-02-25
深入强化学习算法：代码实现与解析

深入强化学习算法：代码实现与解析本项目通过代码实例，剖析经典强化学习算法的内部机制，涵盖：SARSA：基于时间差分学习，直接从智能体与环境的交互中学习。Q-learning：使用最优价值函数估

1 2024-05-08
基于深度Q强化学习的算法交易

股票买卖最佳时机leetcode算法交易使用深度Q强化学习介绍股票交易策略在投资中起着至关重要的作用。然而，在复杂多变的股票市场中设计盈利策略具有挑战性。在这个项目中，我们提出了一种策略，该策略采

0 2024-10-03
强化学习qlearning算法训练贪吃蛇

利用qlearing算法训练贪吃蛇,模型在2000次循环内取得很好的效果,属于伯克利人工智能导论课cs188中的作业

37 2020-08-16
基于强化学习的服务链映射算法

提出基于人工智能技术的多智能体服务链资源调度架构,设计一种基于强化学习的服务链映射算法。通过Q-learning的机制,根据系统状态、执行部署动作后的奖惩反馈来决定服务链中各虚拟网元的部署位置。实验结

14 2021-01-16
论文研究基于动态融合目标的深度强化学习算法研究.pdf

针对深度强化学习算法中存在的过估计问题，提出了一种目标动态融合机制，在Deep [Q] Networks（DQN）算法基础上进行改进，通过融合Sarsa算法的在线更新目标，来减少DQN算法存在的过估计

28 2020-07-22
强化haskell中的强化学习源码

强化:haskell中的强化学习

12 2021-02-25
论文研究分层强化学习研究进展.pdf

首先介绍了半马尔可夫决策过程、分层与抽象等分层强化学习的理论基础；其次，较全面地比较HAM、options、MAXQ和HEXQ四种典型的学习方法，从典型学习方法的拓展、学习分层、部分感知马尔可夫决策过

48 2019-07-27

强化学习算法研究

用户评论

推荐下载