这类符号是HTML、XML 等 SGML 类语言的转义序列。它们不是”编码“,也就是说我们不能使用utf-8、gbk等编码进行处理,需要使用HTMLParse进行处理,完整代码如下:此时运行结果如下:那么此时就已经大功告成了!!!

python-xpath获取html文档的部分内容

python-xpath获取html文档的部分内容