本文研究的基于 Web 的智能信息采集及处理系统,一方面采用高效的 URL 去重和基于模版的下载机制,极大提高了采集Web资源的性能;另一方面应用成熟 先进的自然语言处理技术,对采集信息做智能分类和摘要