论文研究-开环可重入排队网络的递阶增强型学习调度.pdf,  对平均费用型马氏决策过程 ,研究了一种递阶增强型学习算法 ;并将算法应用于一个两台机器组成的开环可重入生产系统 ,计算机仿真结果表明 ,调度结果优于熟知的启发式调度策略.