基于lucene的搜索引擎总结
浅谈网络搜索引擎的实现
知识管理系统网络搜索模块开发实践交流
功能需求
可自定义要搜索的网站列表(以下简称目标列表)
可对目标列表网站的网页内容进行检索
可对目标列表网站的网页内容进行自动分类处理
可自定义更新周期及一些相关性能参数
系统主要功能模块
网络蜘蛛
采集、解析并保存目标列表网站的内容(网页)
全文索引/检索
为目标列表网站内容建立索引
提供内容的全文检索
自动分类
对目标列表网站内容进行分类
基本流程
网络蜘蛛
功能概要
目标文档地址队列w/r
目标文档(网页)获取
目标文档保存
文档解析并得到新的目标文档地址队列和文档正文内容
网络蜘蛛
当前版本的实现
多线程
Apache
推荐下载
-
Lucene搜索引擎开发进阶实战
【编辑推荐】, 从实用的角度出发,理论与实战相结合,配以大量的案例,深入探讨Lucene搜索引擎开发的实现方法和技巧, 收录网上与搜索引擎开发相关的各类问题和误区,并给出解决办法,指导读者在实战中提升
33 2019-01-19 -
lucene搜索引擎代码以及jar包
Lucene作为一个全文检索引擎,其具有如下突出的优点: (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文
6 2020-08-31 -
lucene构建ftp搜索引擎的几篇论文
本人正在学着用luncene构建一个ftp搜索引擎,搜集了一些资料,考虑到自己当时找资料时的痛苦,现在拿出来与大家分享,5分不多吧!欢迎有同样兴趣的与我联系。
30 2019-03-28 -
自己写的lucene实例java搜索引擎
apache开源项目lucene实例实现对文件内容的搜索java搜索引擎
21 2019-05-16 -
我封装的搜索引擎之lucene篇
NULL博文链接:https://sunhao-java.iteye.com/blog/1874396
17 2019-07-14 -
开发自己的搜索引擎lucene and heritrix
1.光盘中所附代码的运行环境服务器Tomcat5.5版本数据库采用MySQL5.0版本JDK采用1.5.0Spring采用1.2.8版本DWR采用1.1.3版本Windows平台Tomcat插件Tom
37 2019-06-04 -
heritrix与Lucene的垂直搜索引擎研究
相关学术论文
41 2018-12-09 -
Lucene全文搜索引擎的设计与实现
经过对搜索引擎的研究,同时结合Lucene自身的特性,本文讨论了Lucene基于全文搜索实现的搜索引擎的设计与实现。需要实现的功能包括支持桌面文件搜索格式(如txt、doc、xls和ppt)、支持分词
8 2023-03-10 -
搜索引擎搜索
在java 程序中调用百度或谷歌搜索引擎搜索关键字并分析得到的网页代码。获得url 标题 摘要等。源代码
67 2018-12-25 -
搜索引擎
搜 索 引 擎— 原理、技术与系统
11 2020-12-16
用户评论