Ta上传的资源 (0)

为了使用python批量爬取某些有防爬虫网站的PDF附件,通过创建header池,以及IP代理池,通过随机抽选的方式随机组合header以及代理IP来进行爬虫访问,模拟不同地址不同浏览器访问操作,规避一些设置防爬虫网站的禁止爬取的操作。

有时需要爬取一个目标网站过多数据的时候,python会在短时间内多次访问,如果目标网站有反扒措施,则IP地址有可能被禁止访问,造成程序失败,可以用IP池做IP代理,headers池伪装不同浏览器,从而更搞笑的爬取数据

java开发过程中,有时候需要反编译一些jar包,学习其对应的代码,本工具可以对jar文件进行反编译,方便查看jar的具体内容