DeepTurtles:用于教乌龟如何使用Deep Q Networks播放“标签”变体的Python代码 源码
深海龟 该存储库包括可执行程序和教程,用于教乌龟如何使用Deep Q-Networks播放“标签”的变体,用户可以修改网络配置,超参数,以及游戏环境,以分析乌龟代理的性能。即时的。 该存储库还包括一系列可视化工具,使用户可以检查代理的深度Q网络在训练过程中的权重如何变化。 这些可视化工具旨在对神经网络进行更加直观的评估,帮助确定训练效率,最佳学习参数,奖励功能,状态作用空间定义,模型配置等。 该项目的目的是研究MDP,状态作用空间定义,采样技术,多主体以及对抗深度Q网络的对抗方法。 我们的研究旨在突出并利用行为和环境对称的存在,以减少代理商培训时间并通过直接矩阵操作来修改代理商策略。 在进
文件列表
DeepTurtles-master.zip
(预估有个4文件)
DeepTurtles-master
requirements.txt
57B
LICENSE
1KB
README.md
7KB
G_Policy.gif
573KB
暂无评论