从html文档中提取text文件