股票买卖最佳时机leetcode Reinforcment Learning:个人项目的各种文件，包括外汇机器人

z44198 1 0 zip 2024-10-02 19:10:29

股票买卖最佳时机leetcode使用DDDQN的强化学习和优先经验回放。主文件：DDDQN_LSTM_XGB_PER.py，一个相当复杂的项目，所以我只会描述一些细节。此类项目需要GPU，否则将需要您多年的培训。我使用了可以同时运行两个会话的RTX 2080 ti。在这个项目中，我为外汇交易创建了一个自治模型。正如你通常看到的那样，我想在另一个环境中试验强化学习，而不仅仅是游戏。当你想学习强化学习时，Q-learning或DQN似乎是最好的开始算法，所以这就是我的选择。从头开始制作DQN涉及很多注意事项，在将代码的各个部分添加到程序之前对其进行单元测试更为重要。在DQN中，您的目标是离散值，模型可以从四种不同的操作中进行选择：0 -什么都不做，1 -买入外汇，2 -卖出外汇，3 -关闭订单。它不能从直接买入到卖出或相反。它必须先关闭(3)前一个订单。为了防止这种情况，程序会评估模型中的每个动作，如果需要，在执行之前将动作调整为合法动作。由于外汇是一个时间序列问题，我主要使用GRU和LSTM进行处理。