p3_collab compet 源码
项目3:合作与竞争 介绍 对于此项目,您将在环境中工作。 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性的,并且为了解决环境,您的特工必须获得+0.5的平均分数(在两个特工均取得最大分值之后,连续100次以上)。 具体来说, 在每个情节之后,我们将每个代理商获得的
用户评论
推荐下载
-
P3CompanionStandardDutchSmartMeterRequirements
ThisdocumentprovidesacompanionstandardforanAutomaticMeterReading(AMR)systemforelectricitythermal,(he
11 2019-07-10 -
c3p包c3p00.9.1.2.jar
c3p0包c3p0-0.9.1.2.jar
17 2020-05-13 -
P2P P2P API源码
对等 P2P API 1소개 1.1 P2P자금관리 P2P금융기업이투자자부터부터부터하여하여하여하하하입니입니입니입니입니。 1.1.1 P2P자금관API목록 전문명 API P2P상계좌상계좌
29 2021-02-23 -
P3P4歌词下载器
自动下载歌曲歌词并能自动命名 可以分移动设备和电脑两种
8 2020-09-11 -
P3P的几篇论文参考
P3P问题的多解现象的概率研究_英文 基于P3P的网络隐私保护等
25 2019-01-13 -
java p2p.part3.rar
p2p 号称自身就等于网路 *下载说明: java p2p.part1.rar, java p2p.part2.rar, java p2p.part3.rar, java p2p.part4.rar
3 2021-05-08 -
Decorated Operations for QorIQ P3_P4_P5Processors
DecoratedOperationsforQorIQP3_P4_P5ProcessorsFreescaleSemiconductorDocumentNumber:AN4181ApplicationN
2 2022-10-03 -
c3p0_091还有源码
c3p Hibernate java 带源码
17 2019-03-04 -
c3p0_0.9.5.1jar及源码
c3p0-0.9.5.1jar包及其源码
16 2019-06-01 -
c3p0jar包和源码
c3p0 jar包和源码 c3p0 0 9 2 1 src zip
72 2019-01-20
暂无评论