该demo利用htmlparser和正则表达式把网页的实词提取出来,为搜索引擎开发做准备