Q函数、greedy策略,强化学习基础实例,采用python语言代码实现