1. 简述 我们在用scrapy爬取数据时,首先就要明确我们要爬取什么数据。scrapy提供了Item对象这种简单的容器,我们可以通过Item定义提取数据的格式,需要爬取哪些字段,其提供了类似于字典的API以及用于声明可用字段的简单语法。如下所示: 下面以爬取伯乐在线文章详情页为范例:http://blog.jobbole.com/all-posts/ # 文件items.py # Item使用简单的class定义语法以及 Field 对象来声明。 import scrapy class articleDetailItem(scrapy.Item): # 标题 title =