软演员关键和扩展:软演员关键和优先体验重播(PER)的PyTorch实施+强调最新经验(ERE)+蒙克豪森RL + D2RL和并行环境源码

qqbrain37305 4 0 ZIP 2021-02-17 10:02:50

软演员关键和扩展 PyTorch实施了具有扩展性PER + ERE + Munchausen RL的Soft-Actor-Critic ,并提供了用于并行数据收集和更快训练的多环境选项。该存储库包括最新的Soft-Actor-Critic版本( )以及SAC的扩展: P rioritizedËxperienceřeplay( ) Èmphasizing最近几个Ë没有忘记过去(xperience ) Munchausen强化学习 D2RL:强化学习深密度架构 N步自举平行环境在ERE的书面实施中,作者使用的是较旧版本的SAC,而该存储库包含SAC的最新版本以及PER的按比例优

推荐下载

YangBaxter方程的解的系列Hecke型矩阵和后代RL算子

我们已经构造了一系列依赖于光谱参数的解,这些解依赖于在具有量子(超)代数对称性的可约化表示的张量积上定义的Yang-Baxter方程。这些序列是从slq(2)不变的Hecke型Rrr(u)矩阵作为后

关键用户和内部顾问职责

目录一. 角色定义二. 项目实施过程中的职责三. 项目上线后的职责四. 人员选配建议五. 人员管理建议

android安装关键资源和手册

Android installation key resources and manual

AOE网活动和关键路径

求出AOE网每个活动的最早开始时间和最迟开始时间；该工程完成的最早时间以及判断出那些是关键路径。

关键路径和最短路径

关键路径

分页和关键字查询

实现一个页面的分布和关键字查询,这个页面可以实现页面的分布,还可以进行关键字的查询,输入关键字

camx关键log和流程.rar

camx关键流程和log

软路由扩展

WAYOS扩展WAN口工具v 很好用的工具

C语言32个关键字和MCU的总结经验

C语言32个关键字、中文解释及其用法和MCU的学习总结经验,C51、PIC、AVR、等等

deep rl principles

deepreinforcelearningprinciples..

用户评论

请输入评论内容

评分：

暂无评论