带有MADDPG的网球:在Pytorch上实现MADDPG 源码
项目3:合作与竞争 介绍 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 下图显示了最终的奖励进度。 环境在1820集中得到解决 算法: 为了解决此环境,我实现了Multi-DDPG算法。 实现的功能如下: 每个特工都有独立的演员和评论家 集中培训:每个代理的批评者不仅将自己
用户评论
推荐下载
-
pytorch进行上采样的种类实例
今天小编就为大家分享一篇pytorch进行上采样的种类实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
12 2020-11-06 -
onvif协议在Android上的实现
onvif协议在Android上的实现 ,今天翻电脑的时候发现了,故上传上来分享给大家。
27 2019-03-28 -
汉明码在FPGA上的实现
用FPGA技术实现汉明码的编码与译码设计
46 2018-12-09 -
在DSP上实现的JPEG算法
在DSP上实现的JPEG算法,简单易用!
40 2018-12-25 -
平行crc在fpga上的实现
循环冗余码校验 CRC(Cyclic Redundancy Check) 广泛用于通讯领域和数据存储的数据检错。 基于 FPGA 在通 讯领域和数据存储的应用越来越广泛,CRC 的编码解码模块已经是
23 2018-12-18 -
模糊Kmeans在hadoop上的实现
这个是一个基于hadoop上的模糊kmeans算法的实现。里面有一个测试数据。程序可以使用。里面有使用方法 代码易懂
9 2020-10-14 -
CRC码在DSP上的实现
循环冗余码(CRC)是一种常用的检测错误码,广泛应用于测控及通信领域。CRC检验的基本思想是利用线性编码理论,在发送端根据要传送的k位二进制码序列,以一定的规则产生一个校验用的监督码(即CRC码)r位
21 2020-06-17 -
sph方法在direct上的实现
流体运动仿真
7 2020-12-09 -
naive bayes在hadoop上的实现
naivebayes在hadoop上的实现,主要是mapreduce程序
26 2019-09-28 -
java tree在web上的实现
一个XML文档容器,不需要复杂的jstree来实现
24 2019-09-03
暂无评论