声明 1、 刚刚开始学习爬虫,写这个纯属兴趣,代码会有很多不严谨 2、 如果要转载,请标记出来源 爬取网站:顶点小说 获取书库资源 1、先查找搜索时的规律: 搜索大道朝天时网站为:https://www.118book.com/book/39/,代号39 搜索永恒圣王时网站为:https://www.118book.com/book/10393/,代号10393 可以得出每一个数字都代表一本书,因此可以使用循环获取某个范围内的所有书名 2、查看网页源代码,查找书名位置,从以下图片可以看出,书名位于id为info的div标签中的h1标签中 3、建立一个字典bookNames,来存放书名以及