wangsuo5962的所有下载-用户-卡了网

为了使用python批量爬取某些有防爬虫网站的PDF附件,通过创建header池,以及IP代理池,通过随机抽选的方式随机组合header以及代理IP来进行爬虫访问,模拟不同地址不同浏览器访问操作,规避一些设置防爬虫网站的禁止爬取的操作。

VM安装三台linux虚拟机IP互通配置如何实现在VM下安装三台虚拟机，并实现三者之间的互通

hadoop集群三台虚拟机的安装配置

集成拍照、扫码、发邮件、统计EXCEL功能的安卓app。可以调用手机内置相机拍照、扫码，调用手机邮箱应用发送邮件，配置EXCEL文件实现人名与邮箱地址的匹配，将获取到的信息统计输出到EXCEL中，按照日期每天生成一个EXCEL记录文件。

有时需要爬取一个目标网站过多数据的时候，python会在短时间内多次访问，如果目标网站有反扒措施，则IP地址有可能被禁止访问，造成程序失败，可以用IP池做IP代理，headers池伪装不同浏览器，从而更搞笑的爬取数据

用于解析xml文档，根据不同的节点名称，提取对应节点下面的内容

java开发过程中，有时候需要反编译一些jar包，学习其对应的代码，本工具可以对jar文件进行反编译，方便查看jar的具体内容