该Github存储库包含“高级毕业项目”的代码,“分析用于快速策略传输的策略梯度方法”。 它是使用PyTorch 1.6.0和更高的高阶梯度库实现的,并且包括多种RL策略梯度算法的常见实现的功能形式。 它将很快通过更多的方法和功能以及算法流程,结果和其他组件的报告进行更新。 希望您能像建造它一样乐在其中! 链接至论文: :