网络爬虫JAVA扩展包,有commons-httpclient-3.1.jar, htmllexer.jar, htmlparser.jar, 试用了,可以正常用