论文研究-基于多智能体强化学习的多机器人协作策略研究.pdf,  研究了一种基于智能体动作预测的多智能体强化学习算法.在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法.此外,研究了该方法在足球机器人