强化学习在阿里的技术演进与业务创新
第一章基于强化学习的实时搜索排序策略调控第二章延迟奖赏在搜索排序场景中的作用分析第三章基于多智能体强化学习的多场景联合优化第四章强化学习在淘宝锦囊推荐系统中的应用第五章基于强化学习的引擎性能优化第六章基于强化学习分层流量调控第七章风险商品流量调控第八章虚拟淘宝第九章组合优化视角下基于强化学习的精准定向广告OCPC业务优化第十章策略优化方法在搜索广告排序和竞价机制中的应用第十一章TaskBot-阿里小蜜的任务型问答技术第十二章DRL导购-阿里小蜜的多轮标签推荐技术
推荐下载
-
强化学习原理与python实现.zip
代码
4 2021-04-14 -
learning to communicate多Agent强化学习的学习与学习.zip
learning-to-communicate, 多Agent强化学习的学习与学习 基于的多agent增强学习学习方法研究杰克。Foerster ,Yannis M 。 Assael,Nando de
21 2020-07-19 -
深度强化学习中的迁移学习
本文综述了迁移学习在强化学习问题设置中的应用。RL已经成为序列决策问题的关键的解决方案。随着RL在各个领域的快速发展。包括机器人技术和游戏,迁移学习是通过利用和迁移外部专业知识来促进学习过程来帮助RL
21 2020-09-21 -
强化学习Q学习算法的应用
用于强化学习,在机器人大赛中用所应用,希望能给大家带来帮组,表述了强化学习方法Q学习在机器人臂章中的应用
39 2020-03-21 -
机器学习的强化学习讲义第2章学习强化学习快速上手的学习材料
机器学习的强化学习讲义第3章,学习强化学习快速上手的学习材料
36 2019-02-17 -
机器学习的强化学习讲义第4章学习强化学习快速上手的学习材料
机器学习的强化学习讲义第4章,学习强化学习快速上手的学习材料
24 2019-02-17 -
Python强化学习实战应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习英文版
Python Intensive Learning Practice: Applying OpenAI Gym and TensorFlow to Master Reinforcement Learn
88 2019-06-26 -
阿里聚安全在互联网业务中的创新实践
阿里聚安全在互联网业务中的创新实践 安全环境的演变 围绕业务的安全模型
27 2019-01-19 -
强化学习基于Sutton和Barto的书第2版在Python中实施强化学习算法源码
强化学习 该存储库包括Sutton和Barto的强化学习书(Ed.2)算法的Python实现。 该书第二版的最新草稿可以在此找到。 在此存储库中,您还可以找到我一直在实施的练习书的解决方案。 结构体
39 2021-02-17 -
_深度强化学习在Atari视频游戏上的应用
考虑到深度学习在图像特征提取上的优势,为了提高深度学习在Atari游戏上的稳定性,在卷积神经网络和强化学习改进的Q-learning算法相结合的基础上,提出了一种基于模型融合的深度神经网络结构。实验表
34 2019-07-24
用户评论