计算两个文本的相似度,使用到了Simhash、分词、海明距离等技术