本文简要介绍了用于网页内容过滤的爬虫的基本原理,同时说明了如何使用HTMLPARSER实现过滤。