论文研究 动作预测在多机器人强化学习协作中的应用.pdf

chenzijing 10 0 PDF 2020-07-21 22:07:08

在多机器人系统中,协作环境探索的强化学习的空间规模是机器人个数的指数函数,学习空间非常庞大造成收敛速度极慢。为了解决这个问题,将基于动作预测的强化学习方法及动作选择策略应用于多机器人协作研究中,通过预测机器人可能执行动作的概率以加快学习算法的收敛速度。实验结果表明,基于动作预测的强化学习方法能够比原始算法更快速地获取多机器人的协作策略。

论文研究 动作预测在多机器人强化学习协作中的应用.pdf

用户评论
请输入评论内容
评分:
暂无评论