SAC:软演员评论家的实施 源码
软演员评论家(SAC) Descllione dell'algoritmo 软演员评论家深度强化学习DQN(Deep Q Learning)的非政策派生,也可以从以下方面进行分类: La Q函数视图的神经网络输入(输入:(stato,azione),输出:valore) 非因果关系的公司 L'agente conosce lo stato in cui si trova(communque una descrizione parziale dello stato attuale) L'agente conosce le azioni cheèin grado di compiere SAC永久性地保护所有人的利益。 L '安特罗皮亚definisce LAcasualità德拉政策:彪èelevata,彪升'输出德拉政策diventa imprevedibile,反之亦然未安特罗
文件列表
SAC-master.zip
(预估有个57文件)
SAC-master
graphs
overlying_plot.png
530KB
single_test
test11.png
19KB
test6.png
33KB
test9.png
31KB
test14.png
19KB
test1.png
29KB
test5.png
32KB
暂无评论