过程:大txt文件拆分成小的txt文件(切词后再存)->小txt文件一个一个读取,构造词典->词典按词频大小降序并把value值置为1,2,3...->读取小txt文件取对应的字典值后保存为数值型的文件