KDMA:基于知识蒸馏的人类启发式多智能体导航源码

shyness60963 7 0 ZIP 2021-05-08 14:05:08

基于知识蒸馏的人类启发式多智能体导航这是代码库,用于支持论文《使用知识蒸馏的人类启发式多代理导航》。摘要-尽管在多智能体导航领域取得了重大进步,但智能体仍然缺乏人类在多智能体环境中展现出的先进性和智能性。在本文中,我们提出了一个框架,用于在完全分散的多代理环境中学习类似于人的通用碰撞避免策略,以进行代理与代理的交互。我们的方法使用知识强化和强化学习,基于通过行为克隆从人类轨迹演示中提取的专家策略来塑造奖励功能。我们证明,使用我们的方法训练的特工可以在避免碰撞和演示所没有提供的目标导向操纵任务中采用类似人的轨迹,胜过专家以及未经知识蒸馏训练的基于学习的特工。通过运动捕捉(参考),我们的方法(我们的)和没有知识提炼的典型强化学习(RL w / o KD)和最佳双向碰撞避免(ORCA)所收集的人体轨迹的比较: 参考我们的不带KD的RL 奥卡依存关系火炬1.8 Nu

文件列表

KDMA-main.zip (预估有个48文件)

KDMA-main

pretrain

policy

events.out.tfevents.1613819047.3163691.0 104KB

ckpt 4.6MB

events.out.tfevents.1613819161.3163662.0 22KB

expert

events.out.tfevents.1612942340.351174.0 92KB

ckpt 2.31MB

config.py 495B

models

env.py 2KB

agent.py 4KB

__init__.py 2B

ppo.py 4KB

networks.py 4KB

env

multi_agent_env.py 10KB

agents

utils.py 430B

base_agent.py 6KB

scenarios.py 9KB

__init__.py 0B

train_expert.py 4KB

requirements.txt 232B

visualize.py 4KB

gallery

c12_1_ours.gif 80KB

c24_3_orca.gif 254KB

c24_3_rl.gif 150KB

c6_ref.gif 55KB

c24_3_ours.gif 163KB

c12_1_ref.gif 101KB

c12_1_rl.gif 73KB

c24_4_ours.gif 139KB

c6_ours.gif 44KB

c24_4_ref.gif 197KB

c6_orca.gif 92KB

c24_3_ref.gif 194KB

c6_rl.gif 36KB

c24_4_rl.gif 155KB

c24_4_orca.gif 144KB

c12_1_orca.gif 171KB

LICENSE 1KB

README.md 4KB

data

__init__.py 12KB

students03.csv 12.01MB

train_policy.py 9KB

distributed.py 2KB

agent.py 2KB

buffer.py 3KB

utils.py 6KB

policy.py 2KB

__init__.py 0B

ppo.py 5KB

actor_critic.py 12KB

用户评论

暂无评论

车辆路径调度问题的启发式算法综述

车辆路径调度问题的启发式算法综述，杨燕旋，宋士吉，车辆路径调度问题是一类具有重大研究意义及广泛应用价值的NP难优化问题。本文给出了该问题的定义和基本描述，并将目前为止被应用�

27 2020-05-13
A算法求解迷宫寻路问题启发式算法

在一个n×m的迷宫里,入口坐标和出口坐标分别为(1,1)和(5,5),每一个坐标点有两种可能:0或1,其中0表示该位置允许通过,1表示该位置不允许通过。以寻路问题为例实现A*算法的求解程序,设计两种不

38 2020-12-06
如何求解问题现代启发式方法Zbigniew Michalewicz

如何求解问题：现代启发式方法(ZbigniewMichalewicz)

28 2019-09-25
启发式U盘病毒查杀修复工具

启发式U盘病毒查杀修复工具,根据U盘病毒特征(隐藏文件夹,并创建伪文件夹.exe文件)进行扫描修复,特征为广义特征,不排除正常文件的可能,请修复前自行仔细判断,非特殊情况请只修复根目录下文件,软件有误

25 2020-04-08
用启发式搜索求解八数码难题

这是人工智能中的一个实验,是用启发式算法求解八数码问题.我觉得我的代码不错,给大家分享.希望大家提出宝贵意见.

22 2020-08-19
论文研究来自Qutrit编织循环元启发式

宇宙论是由物理学家和哲学家发展起来的，用以解释我们对宇宙演化的经验。智能深度学习元启发法为基于量子信息的宇宙学提供了原始框架。物理宇宙学和粒子物理学的数学标准模型将大量的观测结果形式化，但是关于这

10 2020-07-17
如何求解问题现代启发式方法PDF版

这不是一本算法专著。当然书中充满了算法，但那不是本书的主题。本书自在讨论求解问题的可能性。它不仅要向你们提供现有求解问题方法的一些必要的预备知识，更重要的是帮助你们拓展自己的才能去构建新的问题和进行创

37 2020-05-15
a启发式搜索算法的matlab仿真程序

a*启发式搜索算法的matlab仿真程序

21 2019-02-27
用好ESET启发式查毒瞬间检测恶意威胁

很多用户都在使用ESET NOD32杀毒软件，相比之下，其查杀效率极高、防护功能极强、特别是占用资源较少，即便在配置不高的机器中运行，也不会感到迟缓。定期扫描，可以检测并查看系统中存在的威胁，并使用其

13 2019-04-15
启发式算法求解最大团问题研究.pdf

启发式算法求解最大团问题研究.pdfA*ACM/ICPC的资料收藏

32 2019-05-15

KDMA:基于知识蒸馏的人类启发式多智能体导航 源码

文件列表

用户评论

推荐下载

KDMA:基于知识蒸馏的人类启发式多智能体导航源码