本项目是我的毕业设计项目。本人技术水平有限,写出来的东西bug很多,功能也非常不完善,承蒙老师照顾,答辩勉强通过。这个爬虫是针对特定站点的主题爬虫。具备多线程爬取、页面主题相关度计算、子链接主题相关度预测等功能。此外,还包含了一个简单的搜索引擎模块,用于对爬取结果的快速检索。 功能不算很完善,请谨慎下载。