IusedtheCNN+DDPGrealizinginvertedpendulumcontrolpython3.5tensorflow+GPUgym环境。本代码绝无仅有,自己用全连接修改的,输入的图像也是自己画的其中CNN_1与CNN_2是根据全连接进行改造的。CNN_1中是在第二个卷积层的输出中加入Actor网络的输出Policy。CNN_2中是在第一个全连接的输出中加入Actor网络的输出Policy。