10亿级word2vec构造分布式计算的输入数据.py 过程:大txt文件拆分成小的txt文件(切词后再存)->小txt文件一个一个读取,构造词典->词典按词频大小降序并把value值置为1,2,3...->读取小txt文件取对应的字典值后保存为数值型的文件
xfire框架用到的jar包 xfire框架用到的几乎全部jar包,包括:serializer.jarxalan.jarxalansamples.jarxercesImpl.jarxml-apis.jarxsltcapplet.jarxsltcbrazil.jarxsltcejb.jarxsltcservlet.jar