CrawlScript-bin-beta0.3 ,CrawlScript语言0.3beta版,无需配置。 JAVA的爬虫脚本语言,用几行代码即可实现对整个网站的爬取,直接执行demo中的代码,可以获取整个新华网的所有的新闻(从网页中提取出的干净的新闻)。