大规模语料重复串发现算法.doc......................