SAC:软演员评论家的实施源码

park3007 8 0 ZIP 2021-04-08 19:04:34

软演员评论家(SAC) Descllione dell'algoritmo 软演员评论家深度强化学习DQN(Deep Q Learning)的非政策派生,也可以从以下方面进行分类: La Q函数视图的神经网络输入(输入:(stato,azione),输出:valore) 非因果关系的公司 L'agente conosce lo stato in cui si trova(communque una descrizione parziale dello stato attuale) L'agente conosce le azioni cheèin grado di compiere SAC永久性地保护所有人的利益。 L '安特罗皮亚definisce LAcasualità德拉政策:彪èelevata,彪升'输出德拉政策diventa imprevedibile,反之亦然未安特罗

文件列表

SAC-master.zip (预估有个57文件)

SAC-master

graphs

overlying_plot.png 530KB

single_test

test11.png 19KB

test6.png 33KB

test9.png 31KB

test14.png 19KB

test1.png 29KB

test5.png 32KB

test4.png 30KB

test2.png 29KB

test15.png 19KB

test13.png 20KB

test10.png 31KB

test3.png 29KB

test7.png 32KB

test12.png 20KB

divided_plot.png 189KB

agent.py 12KB

utils

memorybuffer.py 2KB

__init__.py 0B

tracker.py 2KB

deepnetwork.py 3KB

main.py 2KB

config.yml 668B

README.md 7KB

generate_graphs.py 2KB

graph.py 1KB

stored_results

test12

notes.txt 47B

test1

config.yml 607B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

notes.txt 57B

test7

config.yml 607B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

notes.txt 56B

test13

notes.txt 43B

test3

config.yml 606B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

notes.txt 40B

test10

config.yml 610B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x256.csv 25KB

notes.txt 42B

test11

notes.txt 54B

test14

notes.txt 32B

test2

config.yml 606B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

notes.txt 153B

test15

notest.txt 42B

test9

config.yml 606B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

test4

config.yml 606B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

notes.txt 41B

test5

config.yml 607B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

test6

config.yml 607B

LunarLanderContinuous-v2_SAC_Continuous_seed3_2x64.csv 25KB

notes.txt 34B

.gitignore 28B

用户评论

暂无评论

每日评论应用源码

第11单元速成:记笔记者描述该作业演示了可用于编写,保存和删除笔记的应用程序。快速后端已用于保存和检索JSON文件中的注释数据。用户故事作为一名用户,我希望能够编写和保存笔记我想删除以前写

8 2021-04-25
视场演员组件虚幻引擎4添加呈现视场的组件源码

视场演员组件。虚幻引擎4 屏幕截图如何安装将插件复制到您的插件中(您可能需要在uproject文件所在的目录中创建一个Plugin文件夹)。启动(或重新启动)虚幻引擎4。在“编辑”->

11 2021-02-24
约50家美食商家线上评论数据集评分商家ID

爬取网上的美食商家的评论，格式txt内容有：商家ID+打分+评价文本

15 2020-05-26
Facebook评论量预测Facebook评论量预测源码

Facebook评论量预测问题陈述-预测评论量的流量,或者只是预测发布后下一个H小时内预期收到一条Facebook帖子的评论数。数据摘要-数据集方式-1。结论- 挑战-1。未来工作范围-1。

10 2021-02-21
IPD实施最成功的两家企业是如何引进应用的

集成产品开发(IntegratedProductDevelopment,简称IPD)是一套先进的产品开发模式、理念与方法。IPD的思想来源于美国PRTM公司出版的《产品及生命周期优化法》(简称PACE

4 2021-01-31
DeBERTa DeBERTa的实施源码

DeBERTa:注意力分散的增强解码的BERT 这个软件库的正式实施消息 2/03/2021 DeBERTa v2代码和900M,1.5B现在在这里。这包括用于我们的SuperGLUE单模型提交并达

12 2021-04-19
话剧演员的形体训练_一_基功

话剧演员的形体训练一、基功刘芷芬姚家征范益松丁根南余忠一综述话剧演员形体训练的基功 , 必须从属于这一专业特定的要求。它担负着解决话剧演员创造角色所需要的形体素

5 2021-04-18
libgdx演员类的使用mario的小例子

libgdx演员类的使用mario的小例子

27 2019-09-19
doodle Docker Doodles的家源码

构建Docker Doodles 可以使用原始docker docker build或新的BuildKit应用程序进行docker build 。夜间构建以及Docker Engine 19.03版

15 2021-04-01
iopt landing IoPT的家源码

iopt-landing:IoPT的家

2 2021-04-08

SAC:软演员评论家的实施 源码

文件列表

用户评论

推荐下载

SAC:软演员评论家的实施源码