股票买卖最佳时机leetcode W4995 Sec:10深度学习的学期项目。具有视觉的DQNAgent介绍强化学习是一个框架,我们在其中训练代理以针对环境做出最佳行动。它允许代理在Atari等游戏中找到最佳策略。股票交易无疑是强化学习可以探索的游戏之一。尽管股票市场不是马尔可夫过程,但我们可以将其历史的一部分包括在内来使过程成为马尔可夫过程。因此,我们可以将深度强化学习引入金融数据建模。在这个项目中,我们探索了训练深度Q学习代理(DQNAgent)以学习投资组合管理和使用卷积网络和ResNet构建时间序列预测器的潜力。此外,我们结合这两种架构来创建具有时间序列可预测性的DQNAgent。数据集我们跟踪道琼斯指数中30只股票的每日收盘价,时间范围为1995年1月1日至2018年12月31日。该模型将在1995年1月到2013年12月的数据上进行训练,并在2014年1月到2016年12月的数据上进行验证,然后我们将在2017年1月到2018年12月进行测试。
暂无评论