本书总共分为三个部分:基础篇、中级篇和深入篇。基础篇包括第1~7章,主要讲解了什么是网络爬虫、如何分析静态网站、如何开发一个完整的爬虫。第1~2章帮助大家回顾了Python和Web方面的知识,主要是为之后的爬虫学习打下基础,毕竟之后要和Python、Web打交道。第3~5章详细介绍了什么是网络爬虫、如何分析静态网站、如何从HTML页面中提取出有效的数据,以及对如何将数据合理地存储成各类文件以实现持久化。第6~7章包含了两个实战项目。第一个项目是基础爬虫,也就是一个单机爬虫,功能是爬取百度百科的词条,并据此讲解了一个爬虫所应该具有的全部功能组件以及编码实现。第二个项目是分布式爬虫,功能和基础爬虫一致,在单