超级马里奥兄弟PPO pytorch:超级马里奥兄弟的近距离策略优化(PPO)算法源码

tricky6338 51 0 ZIP 2021-02-07 16:02:17

[PYTORCH]玩超级马里奥兄弟的近战策略优化(PPO) 介绍这是我的python源代码,用于训练特工玩超级马里奥兄弟。通过使用纸张近端策略优化算法推出近端政策优化(PPO)算法。说到性能,我经过PPO培训的代理可以完成29/32个级别,这比我一开始的预期要好得多。供您参考,PPO是OpenAI提出的算法,用于训练OpenAI Five,这是第一款在电竞游戏中击败世界冠军的AI。具体而言,OpenAI五人队在2018年8月派出了一支由MMR排名的脚轮和前职业球员组成的团队,在Dota 2玩家的99.95%中排名。样品结果动机自从我发布我的A3C实现( )

推荐下载

java马里奥练习源代码

自己学着写的,看上面的资源都是收费的,为了方便新手入坑,免费看看吧,我这边可以跑的,有什么问题,大家探讨,对了,我也是新手,哈哈有啥问题,也欢迎大佬指教!

猫版马里奥VC工程

猫版马里奥VC工程,用VC6.0可直接编译!!

神奇马里奥图标和UI

神奇马里奥UI和其他的图标,可爱风格的。。。。。。。。

经典马里奥网易游戏源码.zip

经典马里奥网易游戏源码.zip

马里奥JAVA源码执行文件

这是山寨版超级玛丽的JAVA执行文件,提供给JAVA初学者学习参考使用。

mldn马里奥完整图片和源码

用了15个积分换来的大家珍惜啊!从点滴学起,大家一起加油!20个字应该够了吧!

papermario纸马里奥反编译源码

纸马里奥这是Paper Mario正在进行的反编译。它构建以下ROM: papermario.us.z64 sha1: 3837f44cda784b466c9a2d99df70d77c322b97

SuperMario Java课设马里奥源码

个人博客大一下Java课程设计,超级玛丽,支持diy地图。画面精美。编码:GBK main方法在com.luck.main.Main中项目截图

Super mario bros A3Cpytorch超级马里奥兄弟的异步优势Actor Critic A3C算法源码

[PYTORCH]扮演超级马里奥兄弟的非同步优势演员评判(A3C) 介绍这是我的python源代码,用于训练特工玩超级马里奥兄弟。通过使用纸异步方法用于深强化学习引入异步优势演员,评论家(A3C)

supermariowar一款由粉丝制作的多人超级马里奥兄弟风格的死亡竞赛游戏源码

supermariowar:一款由粉丝制作的多人超级马里奥兄弟风格的死亡竞赛游戏

用户评论

请输入评论内容

评分：

暂无评论