重要lucene2.0学习文档 Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索和操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接数据
一种通用Cache的设计实现和在天网搜索引擎中的应用 摘要 2 第一章背景介绍 3 1.1万维网和海量信息 3 1.2搜索引擎概述 4 1.3Cache概述 5 第二章相关研究 6 2.1Cache替换算法 6 2.2Cache在搜索引擎中的应用 8 第三章一种通用Cache的设计和实现 9 3.1通用Cache的设计目标 9 3.3.1通用性目标 9
天网中的并行与分布处理 摘 要 本文介绍了“天网”搜索引擎系统2.0版本中所采用的分布并行处理系统结构和关键技术,主要包括搜集子系统和查询子系统两个部分。通过对设计、模拟、实现和实际运行评测等相关过程的描述,展现了系统在性能、负载平衡和扩展性等方面的性质和特点。