#WebCollector WebCollector爬虫框架原始码 WebCollector是基于Java的开源Web爬网程序框架。它提供了一些用于爬网的简单界面,您可以在不到5分钟的时间内设置多线程Web爬网程序。 ## Homehttps ## Document ##安装 没有Maven WebCollector jars在上可用。 webcollector-version-bin.zip包含核心jar。 ## Quickstart让我们从hfut新闻中抓取一些新闻。此演示打印出从hfut新闻的新闻中提取的标题和内容。 : import cn.edu.hfut.dmic.webcollector.model.CrawlDatums ; import cn.edu.hfut.dmic.webcollector.model.Page ; import cn.edu.