本书系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。 目录 前言第一章 引论 上篇 WEB搜索引擎基本原理和技术第二章 WEB搜索引擎工作原理和体系结构第三章 WEB信息的搜集第四章 对搜集信息的预处理第五章 信息查询服务 中篇 对质量和性能的追求第六章 可扩展搜集子系