基于强化学习的动态单机调度研究.pdf
用户评论
推荐下载
-
阿里强化学习资料
第一章基于强化学习的实时搜索排序策略调控;第二章延迟奖赏在搜索排序场景中的作用分析;第三章基于多智能体强化学习的多场景联合优化;第四章强化学习在淘宝锦囊推荐系统中的应用;第五章基于强化学习的引擎性能优
38 2019-09-06 -
强化学习TD算法
强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为输入、通过学习选择能达到其目标的最优动作
21 2019-09-14 -
强化学习完flappybird
使用DQN自动玩flappybird,最近,github上有人放出使用DQN玩Flappy Bird的代码,https://github.com/yenchenlin1994/DeepLearning
39 2019-01-12 -
强化学习入门教材
强化学习有关的教材,涉及理论方面的推导和证明,有助于理解强化学习的代码,需要的可以下载!!!
19 2019-01-14 -
大规模强化学习
本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括:强化学习基本理论和大规模强化学习基本理论。
29 2019-01-17 -
强化学习PPT资源
主要介绍强化学习里面的一些重要概念和基本内容,PPT,总结的还不错,可以参考
25 2019-01-21 -
csps强化学习程序
离散事件动态系统强化学习算法,多前视距离进行控制,在工件加工过程中优化前视距离,使得代价成本最小,获得最优策略
33 2019-01-19 -
深度强化学习_ImitationLearning
Imitation Learning • Also known as learning by demonstration, apprenticeship learning • An expert de
36 2019-02-16 -
深度强化学习_QLearning
Introduction of Q-Learning Tips of Q-Learning Q-Learning for Continuous Actions
43 2019-02-17 -
深度强化学习_ProximalPolicyOptimizationPPO
Proximal Policy Optimization (PPO) default reinforcement learning algorithm at OpenAI Policy Gradien
44 2019-02-15
暂无评论