deep-reinforcement-learning-networks, 一种用于强化学习任务的深层神经网络结构 深层强化学习网络一种用于强化学习任务的深层神经网络结构。纸域模型架构源代码Mnih等,2013AtariDQN ( 缩略图版本)第一个 conv 层:16个滤波器,带步步 4的8个 ×8. 第二层:32个滤波器,带步步