Temporal_DifferenceLearning时序差分学习 Temporal-difference (TD) learning可以说是增强学习的中心,它集成了蒙特卡洛思想和动态编程(dynamic programming, DP)思想,像蒙特卡洛方法一样,TD 方法不需要环境的动态模型,直接从经验经历中学习。
machinglearningyearing maching learning yearing andrew ng 2018最新力作 Machine Learning Yearning is a deeplearning.ai project