基于Spark的机器学习,用于捕获词义 在此存储库中,您将了解如何使用Twitter数据构建Word2Vec模型。 要获得有关如何在IBM 上构建模型的端到端教程,请选择仓库。 先决条件:安装Python,numpy和Apache Spark I.)安装Anaconda会同时安装Python,numpy和其他Python软件包。 如果有兴趣,请访问 II。)下载并安装Apache Spark,请转到此处: : 该步骤对我在Mac 上安装Spark 1.5.1很有用。 III。)在这里添加了一个笔记本带有Twitter数据usign Spark RDDs.ipynb,好消息是Spar