Numerical_TicTacToe_Agent_using_Reinforcement_Learning:建立一个学习弹奏数字井字游戏的RL(强化学习)代理

partly4230 3 0 ZIP 2021-04-04 16:04:06

数值_井字棋_代理_使用_强化_学习建立一个学习弹奏数字井字游戏的RL(强化学习)代理。代理通过Q-Learning学习游戏。游戏( 是最受欢迎和持久的游戏之一。由于它的熟悉性,该游戏通常被用作数学决策过程的入门示例。它的简洁性使其成为一个完美的游戏,可以说明思考前瞻和学习每个决策的结果所带来的收益。井字游戏有多种变体。最经典的是X和O,每个玩家都希望将他们的三个标记放在3x3网格的水平,垂直或对角线行中。该游戏的另一个流行变体是数字井字游戏。使用数字1到9代替X和O。在3x3网格中,数字1到9被填充,每个单元格中都有一个数字。第一个玩家使用奇数游戏,第二个玩家使用偶数游戏,即玩家1只能在单元格中输入一个奇数,而玩家2可以在其余单元格中输入一个偶数。每个数字在整个网格中只能使用一次。在一行中放下15分的玩家(列,行或对角线)将赢得比赛。建议您在玩游戏以更

文件列表

Numerical_TicTacToe_Agent_using_Reinforcement_Learning-chai_main.zip (预估有个6文件)

Numerical_TicTacToe_Agent_using_Reinforcement_Learning-chai_main

README.md 6KB

TCGame_Env.py 5KB

TicTacToe_Agent.ipynb 761KB

States_tracked.pkl 56KB

Sample_episode_img.png 14KB

Policy.zip 23.54MB

用户评论

暂无评论

强化学习资料

强化学习是机器学习领域的重要研究方向，本资料包括史忠植老师的强化学习PPT和国外RL教材。

40 2019-01-14
强化学习导论

强化学习导论，2018年1月完整版，Richard S. Sutton和 Andrew G. Barto所著

24 2019-01-14
强化学习阿里

第一章基于强化学习的实时搜索排序策略调控第二章延迟奖赏在搜索排序场景中的作用分析第三章基于多智能体强化学习的多场景联合优化第四章强化学习在淘宝锦囊推荐系统中的应用第五章基于强化学习的

41 2019-02-18
阿里强化学习

第一章基于强化学习的实时搜索排序策略调控 1 1.1 背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34 2019-02-18
强化学习讲义

机器学习的强化学习讲义第一章，学习强化学习快速上手推荐

209 2019-02-17
增强强化学习

强化学习(reinforcement learning，又称再励学习，评价学习)是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用

45 2019-03-02
分层强化学习

分层强化学习MAXQ文档，有助于对分层强化学习MAXQ的理解

19 2019-05-20
强化学习DQN

这本书详细介绍了强化学习的常用算法以及算法原理，从蒙特卡罗方法到Q_learning最终到DQN

38 2019-05-15
强化学习论文

深度学习中的强化学习相关论文，chatbot对话中使用，效果较好

29 2019-06-04
强化学习笔记

强化学习一些公式的推导和理解，主要是关于Sutton那本reinforcementlearning

32 2019-07-18

Numerical_TicTacToe_Agent_using_Reinforcement_Learning:建立一个学习弹奏数字井字游戏的RL(强化学习)代理

文件列表

用户评论

推荐下载