Chapter08 | 使用Python库抽取一、基础知识点1、Xpath2、DOM树二、信息抽取1、lxml1.1、使用HTML()函数进行文本读取1、获取网页中的所有链接(绝对链接和相对链接)2、获取网页内部所指向的链接3、获取网页内的文字2、BeautifulSoup2.1、BeautifulSoup的好处2.2、解析器2.3、节点类型1、获取类型2、获取网页3、获取网页相对链接2.4、标签定位1、按标签名称定位2、按属性定位3、按文本内容定位4、用正则表达式和自定义函数定位2.5、数据提取1、获取标签中的属性值2、获取标签中的文本 一、基础知识点 1、Xpath XML路径语言(XML