Ta上传的资源 (0)

书籍:《深入浅出强化学习:原理入门》郭宪方勇纯。 《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方

1、算法描述2、伪代码3、python代码实现4、实验结果5、小结有:JohnsonTrotter算法、Kruskal算法、Prim算法、插入排序算法、广度优先查找算法BFS、深度优先查找算法DFS、生成二进制格雷码算法、最优路径算法

算法复杂性经常描述为递归方程,解递归方程得到算法复杂性的具体表示用特征方程解递归方程用生成函数解递归方程用递推方法解递归方程

Qlearning的PPT讲义,包括举例子以及公式推导。QLearning是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的s状态下(s∈S),采取动作a(a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报rewardr,所以算法的主要思想就是将S

单纯形计算方法(SimplexMethod)是先求出一个初始基可行解并判断它是否最优,若不是最优,再换一个基可行解并判断,直到得出最优解或判断出问题无最优解。它是一种逐步逼近最优解的迭代方法。当系数矩阵A中可以观察得到一个可行基时(通常是一个单位矩阵或m个线性无关的单位向量组成的矩阵),则可以通过解

在约束条件下,寻找目标函数z的最大值。在用单纯法求解线性规划问题时,为了讨论问题方便,需将线性规划模型化为统一的标准形式。