zt_逆向最大匹配分词(简陋Demo)算法分析与设计课程实验.
用FMM最大正向匹配算法做的分词代码,希望有用
主要介绍了用python实现前向分词最大匹配算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
该代码为隐马尔科夫的demo案例,适用于已经了解HMM原理进行实践的读者
提供了最大逆向分词算法的伪代码,根据伪代码可以写各种语言下的分词程序
暂无介绍
java版本基于词典匹配,速度为每秒约10万个汉字,本人测试。同时生成倒排索引,倒排索引包含了对于分词的相关信息,如词频。若有Bug可与我联系。
Chinese word segmentation java program
中文分词词典
lucene的分词的测试工程,包括分词器的比较,扩展停用词,同义词分词等