垂直搜索引擎的抓取技术研究 本文首先介绍了垂直搜索抓取系统的体系结构,提出了一种分布式和基于可展插件的垂直搜索抓取系统框架,其分布式特性和插件模式都便于将来的扩。然后讨论了垂直搜索抓取系统中隐蔽网抓取的三个问题,并针对隐蔽网抓取结果消重的问题提出了一种自学习的中文地址判重方法;接下来针对垂直搜索时效性问题提出了一种基于查询驱动