了解网络连接的基本原理后,爬虫原理就很好理解了。网络连接需要电脑一次Requests请求和服务器端的Response回应。爬虫也是需要二件事:(1)模拟电脑对服务器发起Requests请求。(2)接收服务器端的Response的内容并解析提取所需信息。但互联网网页错综复杂,一次的请求和回应不能够批量获取网页的数据,这时就需要设计爬虫的流程,本书中主要运用到两种爬虫所需的流程:多页面和跨页面爬虫流程。