antch:Antch一个快速强大可扩展的Go爬网和抓取框架 源码
安奇 Antch,灵感来自 。 如果您熟悉scrapy,则可以快速入门。 Antch是Go的一种快速,强大且可扩展的Web爬网和抓取框架,用于抓取网站并从其页面提取结构化数据。 开始使用 按照入门说明启动第一个蜘蛛。 产品特点 礼貌,高度并发的Web搜寻器。 功能强大且可自定义的HTTP中间件。 网络蜘蛛的项目数据管道。 内置代理支持(HTTP,HTTPS,SOCKS5)。 对HTML / XML文档的内置XPath查询支持。 易于使用并与您的项目集成。 例子 -Bing每日壁纸。 文献资料 参见
文件列表
antch-master.zip
(预估有个29文件)
antch-master
compression.go
2KB
contrib
dupefilter
rfp_test.go
3KB
rfp.go
3KB
Gopkg.toml
1KB
spider.go
903B
crawler.go
12KB
html.go
2KB
暂无评论