rob311:2020年冬季 源码
rob311 多伦多大学ROB311(人工智能)的实验室和最终项目。 实验1:状态空间搜索 实验2:结构化问题解决和计划 实验3:决策树和对抗游戏 实验4:马尔可夫决策过程 设置 安装Anaconda(Python 3) 打开Anaconda提示 导航到该存储库的根目录,然后运行conda env create -f rob311.yml 。 最终项目 本课程的最终项目是使用OpenAI Gym图书馆探索强化学习。 目标是建立一个代理来解决“ 。 该经纪人能够获得平均超过4700的最佳奖励,在班级中排名第二。 有关实现的详细信息,请参见的注释。
文件列表
rob311:2020年冬季
(预估有个105文件)
.gitignore
2KB
rob311_winter_2020_project_04.pdf
152KB
cartpole-dqn.h5
1.17MB
rob311_winter_2020_final_project.pdf
108KB
num_episodes_condition_22.png
182KB
best_avg_reward_condition_6.png
178KB
best_avg_reward_condition_23.png
202KB
num_episodes_condition_21.png
180KB
num_episodes_condition_23.png
173KB
best_avg_reward_condition_22.png
188KB
暂无评论