dsc 4 39 06 building recommendation system als pyspark seattle ds career 040119
在PySpark中构建推荐系统-实验室 介绍 在最后一个实验中,我们将在Spark编程环境中使用ALS实现一个电影推荐系统。 Spark的机器学习libraray ml随附了非常有效的ALS算法,我们在上一课中已经介绍了该算法。 该实验室将要求您实践一下用于创建和操作pyspark DataFrame的Spark编程技能。 我们将通过逐步的过程逐步发展出使用ALS和pyspark的电影推荐系统,并使用我们在之前的实验中使用的MovieLens数据集。 注意:建议您为完成本实验而大量参考,因为它将引入一些新方法。 目标 你将能够: 表现出对如何将推荐系统用于在线服务/产品的个性化的理解 将数据集解析并过滤为Spark RDD,执行基本功能选择 通过可扩展的网格搜索运行简短的超参数选择活动 训练和评估推荐系统的预测性能 根据训练后的模型生成预测 建立推荐系统 我们已经看到推荐/推荐系统如何
文件列表
dsc-4-39-06-building-recommendation-system-als-pyspark-seattle-ds-career-040119-master.zip
(预估有个8文件)
dsc-4-39-06-building-recommendation-system-als-pyspark-seattle-ds-career-040119-master
.gitignore
64B
data
ratings.csv
2.37MB
movies.csv
483KB
LICENSE.md
1KB
CONTRIBUTING.md
2KB
README.md
12KB
.learn
86B
index.ipynb
17KB
暂无评论