爬虫代码,解析本地HTML文件