在OpenAI的gym环境中,利用深度强化学习的DDPG算法实现立杆子的小游戏仿真,验证算法的效果,加有注释适合初学者,同时可以适应tensorflow2.x版本运行