text-similarity:用TF特征向量和simhash指纹计算中文文本的相似度