html最佳解析器 (1 7 3 2014 5 目前最新) 其解析器能够尽最大可能从你提供的HTML文档来创见一个干净的解析结果 无论HTML的格式是否完整 比如它可以处理: 1 没有关闭的标签 比如: <p>Lorem <p>Ipsum parses to <p>Lorem< p> <p>Ipsum< p> 2 隐式标签 比如 它可以自动将 <td>Table data< td>包装成<table><tr><td> 3 创建可靠的文档结构