Ta上传的资源 (0)

Q学习是增强学习的一种形式,其中机器人学习的是一组状态和动作上的估计函数,它被定义为最大期望折算积累回报,算法可用在不具备动作怎样影响环境的先验知识情况下