从文件中读出文本比较相似度以链表的形式存储统计相同单词数相同单词出现的次数相同单词后面跟着的4个词中的相同单词个数……加权算出相似度