reinforcement learning tutorials:强化学习的基本算法 源码

qqsteam60747 17 0 ZIP 2021-04-21 21:04:21

写在前面 本项目用于学习RL基础算法,尽量做到: 注释详细 结构清晰 代码结构清晰,主要分为以下几个脚本: env.py用于重建强化学习环境,也可以重新归一化环境,例如给动作加噪声 model.py强化学习算法的基本模型,局部神经网络,演员,评论家等 memory.py保存重放缓冲区,用于off-policy agent.py RL核心算法,某种dqn等,主要包含update和select_action两个方法, main.py运行主函数 params.py保存各种参数 plot.py利用matplotlib或seaborn补充奖励图,包括滑动平均的奖励,结果保存在结果文件夹中 运行环境 python 3.7.9 pytorch 1.6.0 张量板2.3.0 火炬视觉0.7.0 体育馆0.17.3 使用说明 本仓库使用到的环境信息请调整 ,在各个算法目录下也有相应的说明(如何

用户评论
请输入评论内容
评分:
暂无评论