在linux系统下运行,用来评测文档的相似度