股票买卖最佳时机leetcode Reinforcment Learning:个人项目的各种文件,包括外汇机器人
股票买卖最佳时机leetcode使用DDDQN的强化学习和优先经验回放。主文件:DDDQN_LSTM_XGB_PER.py,一个相当复杂的项目,所以我只会描述一些细节。此类项目需要GPU,否则将需要您多年的培训。我使用了可以同时运行两个会话的RTX 2080 ti。在这个项目中,我为外汇交易创建了一个自治模型。正如你通常看到的那样,我想在另一个环境中试验强化学习,而不仅仅是游戏。当你想学习强化学习时,Q-learning或DQN似乎是最好的开始算法,所以这就是我的选择。从头开始制作DQN涉及很多注意事项,在将代码的各个部分添加到程序之前对其进行单元测试更为重要。在DQN中,您的目标是离散值,模型可以从四种不同的操作中进行选择:0 -什么都不做,1 -买入外汇,2 -卖出外汇,3 -关闭订单。它不能从直接买入到卖出或相反。它必须先关闭(3)前一个订单。为了防止这种情况,程序会评估模型中的每个动作,如果需要,在执行之前将动作调整为合法动作。由于外汇是一个时间序列问题,我主要使用GRU和LSTM进行处理。