上篇文章通过一个实例简要说明了如何用requests库和re库批量爬取图片,本篇文章将用另外一个实例说明如何爬取知乎上的回答并进行整理。 (一):引入相关库 import re import requests (二):改写headers伪装浏览器 # 知乎有反爬虫,加入http headers伪装浏览器 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36"