python爬虫的入门学习
python爬虫的入门学习 **爬虫流程:获取网页→解析网页→提取内容入库** 1. 获取网页常用的库 1.1 urilib 库 1.1.1 request from urllib import request response = request.urlopen(url地址) # 发送请求,返回一个响应对象 print(response.status) # 获取响应状态码 print(response.read().decode()) # 获取响应内容,并将
python爬虫的入门学习 **爬虫流程:获取网页→解析网页→提取内容入库** 1. 获取网页常用的库 1.1 urilib 库 1.1.1 request from urllib import request response = request.urlopen(url地址) # 发送请求,返回一个响应对象 print(response.status) # 获取响应状态码 print(response.read().decode()) # 获取响应内容,并将