Python 3网络爬虫开发实战 崔庆才著云盘链接
本书介绍了如何利用Python3开发网络爬虫。书中首先详细介绍了环境配置过程和爬虫基础知识;然
后讨论了旧!lib、requests等请求库,BeautifulSoup、XPath、pyquery等解析库以及文本和各类数据库的在
储方法;接着通过多个案例介绍了如何进行Ajax数据爬取,如何使用Selenium和Splash进行动态网站爬取;
再后介绍了爬虫的一些技巧,比如使用代理爬取和维护动态代理池的方法,ADSL拨号代理的使用,图形、
极验、点触、宫格等各类验证码的破解方泣,模拟登录网站爬取的方法及Cookies池的维护。
此外,本书还结合移动互联网的特点探
暂无评论