在PySpark中构建推荐系统-实验室 介绍 在最后一个实验中,我们将在Spark编程环境中使用ALS实现一个电影推荐系统。 Spark的机器学习libraray ml随附了非常有效的ALS算法,我们在上一课中已经介绍了该算法。 该实验室将要求您实践一下用于创建和操作pyspark DataFrame的Spark编程技能。 我们将通过逐步的过程逐步发展出使用ALS和pyspark的电影推荐系统,并使用我们在之前的实验中使用的MovieLens数据集。 注意:建议您为完成本实验而大量参考,因为它将引入一些新方法。 目标 你将能够: 表现出对如何将推荐系统用于在线服务/产品的个性化的理解 将数据集解析并过滤为Spark RDD,执行基本功能选择 通过可扩展的网格搜索运行简短的超参数选择活动 训练和评估推荐系统的预测性能 根据训练后的模型生成预测 建立推荐系统 我们已经看到推荐/推荐系统如何