搜索引擎的技术与原理 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书
LSI模型在信息检索中的应用 :介绍了I.SI技术在中文信息中的应用及其在实际应用中可能会出现的问题,并给出了解决办法。通过将查询和文 档在多维空间进行投影,将共现词投到同一维上,建立“词一文档”高维空间,使用$VD方法对高维空间进行分解、降维,得 到词、文档、查询的向量表示,达到x,~ee文信息的检索;使用PRF(Pseudo