本章内容,我们主要来讲一下Python内置的HTML解析库HTMLParser模块,基本上也是应用于页面抓取上,假设,我们需要去收集页面上已存在的静态链接,但是页面肯定代码量都非常大,并且页面也很多,这样看来,会比较麻烦,工作量也非常大,这个时候,我们就可以用到htmlparser模块,一起来了解具体使用内容。例如,连接的start tag是,那么对应的参数tag='a'(小写)。attrs是start tag 中的属性,以元组形式返回。

python中HTMLParser模块知识点总结

python中HTMLParser模块知识点总结