阿里强化学习在阿里的技术演进与业务创新

ytaxm 31 0 RAR 2018-12-17 10:12:36

当前的机器学习算法⼤致可以分为有监督的学习、⽆监督的学习和强化学习（Reinforcement Learning）等。强化学习和其他学习⽅法不同之处在于强化学习是智能系统从环境到⾏为映射的学习，以使奖励信号函数值最⼤。如果智能体的某个⾏为策略导致环境正的奖赏，那么智能体以后产⽣这个⾏为策略的趋势便会加强。强化学习是最接近于⾃然界动物学习的本质的⼀种学习范式。然⽽强化学习从提出到现在，也差不多有半个世纪左右，它的应⽤场景仍很有限，规模⼤⼀点的问题就会出现维数爆炸，难于计算，所以往往看到的例⼦都是相对简化的场景

用户评论

暂无评论

大规模强化学习

本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括：强化学习基本理论和大规模强化学习基本理论。

29 2019-01-17
强化学习PPT资源

主要介绍强化学习里面的一些重要概念和基本内容，PPT,总结的还不错，可以参考

25 2019-01-21
csps强化学习程序

离散事件动态系统强化学习算法，多前视距离进行控制，在工件加工过程中优化前视距离，使得代价成本最小，获得最优策略

33 2019-01-19
深度强化学习_ImitationLearning

Imitation Learning • Also known as learning by demonstration, apprenticeship learning • An expert de

36 2019-02-16
深度强化学习_QLearning

Introduction of Q-Learning Tips of Q-Learning Q-Learning for Continuous Actions

43 2019-02-17
深度强化学习_ProximalPolicyOptimizationPPO

Proximal Policy Optimization (PPO) default reinforcement learning algorithm at OpenAI Policy Gradien

44 2019-02-15
深度强化学习综述

深度强化学习综述,阐述近些年来深度学习方法的脉络，发展和概况，有助于读者快速了解深度强化学习整体概况

23 2019-03-02
强化学习算法研究

针对智能Agent运动中，普遍存在的避障问题，结合试错和环境交互，得出策略。

47 2019-03-15
RNN强化学习论文

人工智能中循环神经网络（RNN）、序列模型，强化学习方面的论文。

24 2019-03-09
各种强化学习算法

各种强化学习算法

25 2019-03-30

阿里 强化学习在阿里的技术演进与业务创新

用户评论

推荐下载

阿里强化学习在阿里的技术演进与业务创新