暂无评论
TextRank算法的改进及在政法全文检索系统中的应用,TextRank算法是受PageRank算法的启示
lucene文档检索系统,java源码,可执行程序,支持pdf,doc,xls,ppt,html,txt。
FTS-based full-text searcher in Android system
针对Lucene自带中文分词器分词效果差的缺点,在分析现有分词词典机制的基础上,设计了基于全哈希整词二分算法的分词器,并集成到Lucene中,算法通过对整词进行哈希,减少词条匹配次数,提高分词效率。该
Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用。通过对基于最大匹配算法的中文分词器的设计与改进,并引入文本解析器与构建同义词词库引擎,使得Lucen
NULL 博文链接:https://gznofeng.iteye.com/blog/1129902
Lucene's summary of several Chinese word segments
采用反向机械分词算法。 对数字、英文进行特别的处理。 支持中英文数字混合词的处理。 分词速度快。
Lucene.net中文分词资料不是很多,很早就在看肖波的KTDictSeg,觉的分词效果不错,但是没有lucene接口,看他的blog也是很长时间没有更新了 他在他的blog中提到将在下一个版本中提
Lucene是非常优秀的成熟的开源的免费的纯java语言的全文索引检索工具包。Lucene是一个高性能、可伸缩的信息搜索(IR)库。InformationRetrieval(IR)library.它
暂无评论