改进的shingling算法On the Evolution of Clusters of NearDuplicateWeb 英文原版论文,看看作者是如何改进shingling算法来实现搜索引擎去重功能