数据科学Capstone Sparkify项目 Sparkify是一种虚构的流音乐服务,类似于Spotify或Pandora,用户可以通过免费或付费订阅计划收听音乐。 使用免费计划,用户必须收听歌曲之间的广告。 使用付费订阅,用户不会在歌曲之间收听广告,也可以选择要收听的歌曲。 该项目的目标是预测用户是否会使用我们的Music Streaming Sparkify服务。 ·· 目录 关于该项目 在这个项目中,您将练习使用Spark和工程师功能来操纵大型数据集,以预测用户是否会流失。 此外,您还将学习如何使用Spark MLlib来准备机器学习模型并将其应用于大型数据集。 预测客户流失是整个企业都可能遇到的问题。 入门 要启动并运行本地副本,请遵循以下简单步骤。 主要组件是文件Sparkify.ipynb,它是包含代码的Jupyter Notebook。 数据源位于文件mini_spark