软演员关键和扩展:软演员关键和优先体验重播(PER)的PyTorch实施+强调最新经验(ERE)+蒙克豪森RL + D2RL和并行环境 源码

qqbrain37305 4 0 ZIP 2021-02-17 10:02:50

软演员关键和扩展 PyTorch实施了具有扩展性PER + ERE + Munchausen RL的Soft-Actor-Critic ,并提供了用于并行数据收集和更快训练的多环境选项。 该存储库包括最新的Soft-Actor-Critic版本( )以及SAC的扩展: P rioritizedËxperienceřeplay( ) Èmphasizing最近几个Ë没有忘记过去(xperience ) Munchausen强化学习 D2RL:强化学习深密度架构 N步自举 平行环境 在ERE的书面实施中,作者使用的是较旧版本的SAC,而该存储库包含SAC的最新版本以及PER的按比例优

用户评论
请输入评论内容
评分:
暂无评论