JAVA版本,每秒约10万汉字,基于词典的中文纯文本分词程序

lth14095 17 0 RAR 2019-05-17 06:05:20

java版本基于词典匹配,速度为每秒约10万个汉字,本人测试。同时生成倒排索引,倒排索引包含了对于分词的相关信息,如词频。若有Bug可与我联系。

用户评论
请输入评论内容
评分:
Generic placeholder image 卡了网匿名网友 2019-05-17 06:05:20

非常好,很好用

Generic placeholder image 卡了网匿名网友 2019-05-17 06:05:20

简单,使用,挺快的分词。

Generic placeholder image 卡了网匿名网友 2019-05-17 06:05:20

请作者简要说一下思路吧。代码没有注释看着很头疼

Generic placeholder image 卡了网匿名网友 2019-05-17 06:05:20

请问,在这句代码中con=JDBCUTIL.connectToOracle.getConnection(); 提示JDBCUTIL未定义是怎么回事?这个是在哪里定义的?还是因为少了什么包?