基于分词的中文文本相似度计算研究