IKAnalyzer2012_u6最新可用的分词包可以整合到Lucene3.6中绝对好用
solr-ik中文分词器资源包,包括ext.dic,,IKAnalyzer.cfg.xml,,ik-analyzer-solr5-5.x.jar,,managed-schema,,solr-analy
Solr是一个全文检索服务器,基于Lucene3.5开发的,我们可以在solr的基础上进行定制化的开发。新手学习记录了学习过程为后来者提供个参考吧。
Lucene.Net2.3.1开发介绍——二、分词(四),这是一个系列的文档,太多了,只好分开
这份词库包含了1866万个词语,可用于分词和自定义词汇。无需费力去收集和整理词库,直接使用即可提高分词效率和准确度。此词库涵盖了各种专业术语和通用词汇,可满足不同行业和领域的需求。建议将其应用于文本处
中科院分词系统java版ICTCLAS50_Windows_32_JNI.rar;里面有最新的授权文件,正确执行demo;里面包含java借口使用说明以及分词系统的演示说明
完整的同义词词集,可用于分词,一份不可多得的同义词词典。
中科院最新版中文分词软件。2014版,各种材料齐全,包含代码、文档等等;希望大家爱用。以备不时之需。
ICTCLAS中科院分词在java上的实现demo包含了ICTCLAS接口开发文档
Chinese Academy of Sciences word segmentation component (ICTCLAS) Asp.net version