股票买卖最佳时机leetcode自然语言处理问题陈述做出买卖股票的决定通常取决于有关公司业绩的最新消息。我使用自然语言处理来收集在线文章,将这些文章的内容矢量化,并根据这些文章的内容创建一个买卖给定股票的标准。为了选择将要使用的模型,将尝试使用具有交叉验证的网格搜索来尝试一系列不同的模型,并且将选择在初始阶段具有最佳性能的模型。数据说明:数据是使用Selenium Web驱动程序从网站上提取了100篇文章。股票价值是从使用的数据中获取的。一旦数据被拉入数据框,就会发现没有任何有用数据的广告文章也被保存了。由于其中没有文本数据,因此在数据清理期间删除了这些行。目标列是通过取下一周股票价值的汇总值的差异创建的。如果平均百分比差异为正,则将值1分配给目标。否则分配值为-1。计数向量器用于处理文本数据。训练和测试数据上的模型性能确定对模型性能进行基准测试的第一件事是基线准确度。测试集的基线准确率为0.59。我们的数据是在5个不同模型上训练的,使用2个不同的向量化器来处理标题的文本。每个模型的训练和测试分数如下所示。