提取网页内容,去掉标签,去掉无用链接,主要服务于自然语言处理中对网页内容要求的应用。开发语言:C/C++