基于字符统计的新闻网页去重方法研究,蒋金平,郭艳卿,针对新闻报道网页篇幅较短的特点,提出了一种基于字符统计的新闻网页去重方法。通过字符统计和去停用词处理提取出新闻报道中具有