本程序使用ICTCLAS中文分词系统,支持中文分词,同时实现高效率的关键字匹配,使用的分词系统支持用户自定义词典,并支持GBK和UTF-8编码,在Linux系统上运行,同时避免某些因证书引起的问题,适用于个人研究,因商业使用带来的问题,本人不负责。 系统采用2中高效的算法进行多模式串的匹配。 测试与Ubuntu14.04系统。