RL AD 源码
通过计划培训无人驾驶代理进行强化学习 项目摘要 该项目背后的主要动机是探索以自动驾驶为目的的强化学习的有效性。 另一个动机是在可预见的未来对自动驾驶汽车的需求不断增长。 主要目标是培训代理商在城市和高速公路上均执行自动驾驶,这将需要在两种类型的环境中培训代理商。 为了实现此目的,必须将模拟环境(如由提供的模拟环境)用于测试目的。 进行强化学习的方法有多种,一种用作单一代理,某些使用多种代理,目前的目标是仅使用一种代理,但通过进一步的研究,也许多种代理可能会产生更好的结果。 还有多种方法,一些方法仅使用强化学习,而另一些方法则结合使用计划和强化学习。 就目前的观点而言,结合强化倾斜的规划已显示出更有效的自动驾驶功能,但实施起来也更加复杂。 完整的项目提案: 进度更新 02/16/21 创建项目建议 02/21/21 探索探索了AirSim中的各种培训环境。 02/22/21 发
用户评论
推荐下载
-
AD7705LCD源码
基于51单片机 使用高精度AD7705 实现万用表设计源码,亲测可用,参数处理自己搞定
22 2019-03-16 -
Practica2.1_AD源码
Practica2.1_AD
4 2021-04-23 -
dbt_ad_reporting源码
广告报告 此dbt包可聚合和建模来自多个Fivetran广告连接器的数据。 该软件包对来自各种广告连接器的架构进行了标准化,并为所有活动创建了一个报告模型。 它使您可以按广告系列,广告组和UTM参数分
5 2021-04-04 -
draw ad绘图应用源码
抽奖 绘图应用
7 2021-02-19 -
AD1582AD1583AD1584AD1585da
AD1582AD1583AD1584AD1585da
8 2022-09-30 -
RL2020_Building a Complete RL System_Demonstration爱丁堡大学强化学习课程构建完整的RL系统讲座的演示代码
演示代码“构建完整的RL系统”讲座 介绍 此代码演示了我们对确定性FrozenLake任务的SARSA实现,并作为“构建完整的Rl系统”讲座的附加信息。 该讲座是爱丁堡大学一部分。 依存关系 要运行p
8 2021-03-20 -
rl78g13for ti
经过4天3夜的奋斗,TI杯终于结束。俗话说的好,做任何一件事都可以得到好多东西。这次TI杯,我选用了瑞萨RL78/G13,并选做了D题,手势识别。由于我技术不够,导致算法的优化以及识别的容错率比较低,
14 2020-11-10 -
Deep RL for Financial Portfolio.pdf
强化学习在投资组合中的使用论文,强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与
12 2020-09-11 -
RL负载电阻的简单介绍
电阻RL是负载电阻,R为稳压调整电阻(也称为限流电阻),D为稳压管.按稳压电路设计准则,在输入电压基本不变时,RL变小时,流过RL的电流增加,但流过D的电流却减少。
18 2020-09-20 -
RL电路的瞬态响应.pdf
目标: 本实验活动的目标是通过脉冲波形研究串联RL电路的瞬态响应并了解时间常数的概念。 背景: 本实验活动与我们的另一个实验活动(活动4:RC电路的瞬态响应)类似,区别在于电容
16 2020-05-14
暂无评论