HtmlAgilityPack 是一个开源的快速解析Html的C#类库。简单理解,它可以像解析Xml一样,将Html根据XPATH转化为一个个Node节点,并支持调整节点以及节点的各种属性。传送门:多种方式加载Html主要加载方式有3类:从网络链接加载、从字符串文本中加载、从文件加载HtmlNode常用方法使用SelectNodes()和SelectSingleNode()方法来获取的目标节点,分别对应HtmlNodeCollection和HtmlNode两个类。注意:id class 属性匹配大小写敏感1. 通过属性和路径匹配来选择对应的节点2. 获取节点文本内容根据需求不同,通过不同的方式来获取相应的文本内容。这里以href属性举例,同样可以用在class/src/id等属性上。其实HtmlWeb说白了也是封装的HttpWebRequest进行网络请求的,所以暴露一个委托给外部用以修改请求上下文。
暂无评论