Lucene中文分词组件 JE-Analysis 1.4.0
该组件免费安装使用传播,无限制商业应用,但暂不开源,也不提供任何保证分词效率:第一次分词需要1-2秒(读取词典),之后速度基本与Lucene自带分词持平运行环境:Lucene1.9+内存消耗:30M+1.4.0——2006-08-21增加词典的动态扩展能力1.3.3——2006-07-23修正无法多次增加词典的问题1.3.2——2006-07-03修正细粒度分词错误的问题1.3.1——2006-06-23修正在某些情况下分词遗漏的问题1.3——2006-06-22实现了词尾消歧算法中第一层的过滤增加日期时间的匹配
推荐下载
-
中文分词设计与实现组件
介绍了目前国内外web文本挖掘技术的研究动态和水平,主要包括web文本挖掘的分类,web文本挖掘的静态和动态统计分析,中文分词技术等内容
27 2019-05-13 -
MMAnalyzer分词jar包lucene_core_2.4.1.jarje_analysis_1.5.3.jar
Lucene中文分词器中的极易分词组件,包含jeasy.analysis.MMAnalyzer,以及依赖包lucene-core-2.4.1.jar!
45 2019-05-07 -
jieba php结巴中文分词做最好PHP PHP中文分词中文断词组件Jieba中文为to stutter中文文本分割构建为最佳PH
“结巴”中文分词:做最好PHP中文分词,中文断词组件,当前翻译版本为jieba-0.33版本,未来再慢慢往上升级,效能也需要再改善,请有兴趣的开发者一起加入开发!若想使用Python版本请前往 现在已
7 2021-02-22 -
KTDictSeg中英文分词组件V1001版本
KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力主要性能指标:分
48 2019-01-11 -
Lucene组件
Lucene组件,我博客里有组件的详细用法
17 2019-03-17 -
solr6.3lucene6.3ik analyzer中文分词
solr6.3/lucene 6.3 ik-analyzer 中文分词包及demo、文档
26 2020-09-19 -
Lucene47IKAnalyzer中文分词入门教程
Lucene4.7+IK Analyzer中文分词入门教程
38 2019-02-24 -
中文搜索分词lucene包加paoding包
中文分词lucene包+paoding包
41 2019-07-13 -
lucene3.5IKAnalyzer3.2.5实例中文分词通过
lucene3.5IKAnalyzer3.2.5实例中文分词通过,目前在网上找的lucene和IKAnalyzer的最新版本测试通过。内含:示例代码,以及最新jar包。lucenelucene3.5I
38 2019-05-08 -
运用在lucene中的中文分词算法源码
运用在lucene中的中文分词算法源码
5 2021-04-29
用户评论