w2v:使用Spark使用Twitter数据对Word2Vec进行建模。 博客: 源码
基于Spark的机器学习,用于捕获词义 在此存储库中,您将了解如何使用Twitter数据构建Word2Vec模型。 要获得有关如何在IBM 上构建模型的端到端教程,请选择仓库。 先决条件:安装Python,numpy和Apache Spark I.)安装Anaconda会同时安装Python,numpy和其他Python软件包。 如果有兴趣,请访问 II。)下载并安装Apache Spark,请转到此处: : 该步骤对我在Mac 上安装Spark 1.5.1很有用。 III。)在这里添加了一个笔记本带有Twitter数据usign Spark RDDs.ipynb,好消息是Spar
文件列表
w2v-master.zip
(预估有个23文件)
w2v-master
mllib-scripts
.ipynb_checkpoints
Word2Vec with Twitter Data using Spark RDDs-checkpoint.ipynb
125KB
tweets-to-w2v.py
5KB
visualize-words.py
3KB
README.md
3KB
dist-to-words.py
1KB
cluster-words.py
2KB
Word2Vec with Twitter Data using Spark RDDs.ipynb
125KB
暂无评论