很多人知道爬虫,也很想利用爬虫去爬取自己想要的数据,那么爬虫到底怎么用呢?今天就教大家编写一个简单的爬虫。 下面以爬取笔者的个人博客网站为例获取第一篇文章的标题名称,教大家学会一个简单的爬虫。 第一步:获取页面 #!/usr/bin/python # coding: utf-8 import requests #引入包requests link = "http://www.santostang.com/" #定义link为目标网页地址 # 定义请求头的浏览器代理,伪装成浏览器 headers = {'User-Agent' : 'Mozilla/5.0 (Windows; U; Windows