wombat:具有优雅DSL的轻量级Ruby Web爬网程序可从页面提取结构化数据 源码
袋熊 带有优雅DSL的Web抓取工具,可解析来自网页的结构化数据。 用法: gem install wombat 抓取页面: 使用Wombat的最简单方法是调用Wombat.crawl并将其传递给一个块: require 'wombat' Wombat . crawl do base_url "https://www.github.com" path "/" headline xpath : "//h1" subheading css : "p.alt-lead" what_is ( { css : ".one-fourth h4" } , :list ) l
文件列表
wombat-master.zip
(预估有个64文件)
wombat-master
.travis.yml
103B
Guardfile
521B
wombat.gemspec
5KB
Rakefile
938B
Gemfile
252B
Gemfile.lock
3KB
VERSION
6B
.rspec
7B
.document
55B
暂无评论