WebCollector:WebCollector爬虫框架原始码 源码
#WebCollector WebCollector爬虫框架原始码 WebCollector是基于Java的开源Web爬网程序框架。它提供了一些用于爬网的简单界面,您可以在不到5分钟的时间内设置多线程Web爬网程序。 ## Homehttps ## Document ##安装 没有Maven WebCollector jars在上可用。 webcollector-version-bin.zip包含核心jar。 ## Quickstart让我们从hfut新闻中抓取一些新闻。此演示打印出从hfut新闻的新闻中提取的标题和内容。 : import cn.edu.hfut.dmic.webcollector.model.CrawlDatums ; import cn.edu.hfut.dmic.webcollector.model.Page ; import cn.edu.
文件列表
WebCollector-master.zip
(预估有个67文件)
WebCollector-master
WebCollector-JRuby
webcollector.gemspec
409B
webcollector-0.1.0.gem
6.88MB
lib
webcollector.rb
790B
README.zh-cn.md
2KB
webcollector-2.40-beta-bin.zip
6.87MB
WebCollector
pom.xml
11KB
暂无评论