使用Spark和Flask的可扩展的在线电影推荐器 该Apache Spark教程将指导您逐步使用实现,通过 使用构建电影推荐器。 它分为两个部分。 第一个是关于将电影和收视率数据获取和解析为Spark RDD。 第二个是关于构建和使用推荐器,并将其保留以供以后在我们的在线推荐器系统中使用。 本教程可独立用于基于MovieLens数据集构建电影推荐器模型。 第一部分中的大部分关于如何在公共MovieLens数据集上使用ALS的代码来自于我的解决方案,该解决方案是提出的一个练习, 也。 从那里开始,我进行了少量修改,以使用较大的数据集,然后编写了有关如何存储和重新加载模型以供以后使用的代码,最