基于强化学习的动态单机调度研究.pdf

yantwodong 41 0 PDF 2019-05-13 07:05:49

生产调度位于计算机集成制造系统体系结构中的中间层，是控制与管理一体化的接合部。向上要给企业经营战略决策层提供决策依据，向下要安排生产加工任务，指导监督控制层的运作。因此，生产调度是实施计算机集成制造系统的关键。在实际生产过程中，绝大多数的调度问题都属于动态调度问题。目前，大部分动态调度问题都利用调度规则来进行解决，但调度规则本质上是一种局域内的贪心搜索方法，盲目追求单一目标，同时其无法根据系统环境状态的改变进行自适应调整，因此没有一种调度规则能够在系统各项重要调度性能指标下都表现出良好的调度性能。因为Agent具有适应动态变化环境以及交互协商的能力，因此很多学者利用Agent技术来解决动态调度问题，但如何提高Agent的学习能力是Agen

用户评论

暂无评论

阿里强化学习资料

第一章基于强化学习的实时搜索排序策略调控；第二章延迟奖赏在搜索排序场景中的作用分析；第三章基于多智能体强化学习的多场景联合优化；第四章强化学习在淘宝锦囊推荐系统中的应用；第五章基于强化学习的引擎性能优

38 2019-09-06
强化学习TD算法

强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法，把环境的反馈作为输入、通过学习选择能达到其目标的最优动作

21 2019-09-14
强化学习完flappybird

使用DQN自动玩flappybird，最近，github上有人放出使用DQN玩Flappy Bird的代码，https://github.com/yenchenlin1994/DeepLearning

39 2019-01-12
强化学习入门教材

强化学习有关的教材，涉及理论方面的推导和证明，有助于理解强化学习的代码，需要的可以下载！！！

19 2019-01-14
大规模强化学习

本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括：强化学习基本理论和大规模强化学习基本理论。

29 2019-01-17
强化学习PPT资源

主要介绍强化学习里面的一些重要概念和基本内容，PPT,总结的还不错，可以参考

25 2019-01-21
csps强化学习程序

离散事件动态系统强化学习算法，多前视距离进行控制，在工件加工过程中优化前视距离，使得代价成本最小，获得最优策略

33 2019-01-19
深度强化学习_ImitationLearning

Imitation Learning • Also known as learning by demonstration, apprenticeship learning • An expert de

36 2019-02-16
深度强化学习_QLearning

Introduction of Q-Learning Tips of Q-Learning Q-Learning for Continuous Actions

43 2019-02-17
深度强化学习_ProximalPolicyOptimizationPPO

Proximal Policy Optimization (PPO) default reinforcement learning algorithm at OpenAI Policy Gradien

44 2019-02-15

基于强化学习的动态单机调度研究.pdf

用户评论

推荐下载