URNAI工具 URNAI工具是一个模块化的深度强化学习(DRL)工具箱,它支持多个环境,例如 , , 和 。 URNAI工具的主要目标是为DRL代理程序的开发提供易于使用的模块化平台。典型的强化学习场景的每个部分(例如动作空间,状态表示,奖励函数,算法等)都被视为URNAI中的模块,并且可以与其他动作空间,状态表示等交换。为满足需求,URNAI随附了一系列现成的DRL算法,环境包装器,动作包装器,奖励函数和状态表示,使开发人员可以轻松组合不同的学习配置并快速迭代它们。 入门 请按照以下说明在您的PC上获取该工具包的工作副本。最好使用“ solve_x.py”文件作为基础来开始开发自己的代理。 URNAI当前正在上积极开发。如果您想获得该工具包的最新版本,请考虑从1.0版进行安装,因为已修复了许多错误,并进行了改进,尽管可能更加不稳定。 先决条件 Python 3.6 Python