基于深度确定性梯度策略(DDPG)算法的售电公司竞价策略研究是针对电力市场中多个售电公司的竞标和报价策略进行的研究。传统的博弈论方法在寻求电力市场均衡时存在信息完备和简单市场环境的局限性,不能直观地反映竞争性市场的环境。因此,本研究采用深度确定性梯度策略算法对发电公司的售价进行建模。相比传统的强化学习算法,该算法克服了低维离散状态空间和不稳定收敛性的问题,具有更高的精度。实验结果表明,该方法能够在不完全信息环境下收敛到完全信息的纳什均衡。此外,通过定量调整发电商的耐心参数,该方法能够直观地反映不同的默契合谋程度,是分析市场策略的有效工具。深度强化学习在当前非常受关注,本研究为深度强化学习方向的研究者提供了一个有潜力且需要进一步改进的基础。