RL Taxonomy:强化学习算法的宽松分类法 源码

corporate68819 11 0 ZIP 2021-04-19 10:04:52

RL分类法 这是强化学习算法的宽松分类法。我绝不是这方面的专家,我正在将其作为学习过程的一部分。请注意,这里列出的算法比这里列出的要多得多,而且我什至不知道如何对它们进行分类。无论如何,请PR改正或提出新建议。 请注意,此文件是由taxonomy.py生成的。 目录: 分类 以下是强化学习算法的分类。实线表示从一个想法到另一个想法的某种进展。虚线表示连接松动。在底部,您可以看到算法发布年份的时间表。 建议在新窗口中打开.SVG文件,因为将鼠标悬停在该算法上将显示包含该算法描述的工具提示,单击该节点将打开其描述的链接。 强化学习 强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关[来自 ] 与后续想法相关: 有用的链接: 影片: 免费模型 (路径:->) 在无模型强化学习中,主体直接尝试预测价值/策略,而无需或试图对环境进行建模 价值梯度 (路径

用户评论
请输入评论内容
评分:
暂无评论