一 介绍  Python上有一个非常著名的HTTP库――官网告诉我们,它比原来的requests模块更加强大,并且为我们提供了一些新的功能!二 安装  安装requests-html非常简单,一行命令即可做到。以往爬虫的请求与解析  而在requests-html里面只需要一步就可以完成而且可以直接进行js渲染!而requests-html自带了这个功能,所以在爬取网页等方面非常方便。  1、基本使用links返回的结果absolute_links返回的结果  request-html支持CSS选择器和XPATH两种语法来选取HTML元素。这种情况只发生一次。核心的解析类也大多是使用 PyQuery 和 lxml 来做解析,简化了名称,挺讨巧的。除了一些基础操作,这个库还提供了一些人性化的操作。render 函数可以使用 js 脚本来操作页面,滚动操作单独做了参数。这对于上拉加载等新式页面是非常友好的。

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用

python爬虫 requests-html的使用