中文分词处理工具包很准的一款分词器
基于BiLSTM模型训练而成,包含词性标注,分词,实体识别等, 都准确率挺高的,用来做分词挺好的,调用简单无需配置一大堆东西,仅在linux Python3 环境测试通过,使用案例: import fool text = "两个傻子" print(fool.cut(text)) # ['两个', '傻子']
用户评论
推荐下载
-
很好用的分词器
花积分下载的,免费共享!
6 2020-12-20 -
elasticsearch的ik分词器
已编译,编译jdk为1.8.0,适用于es2.4.0,解压至es目录的plugin的ik下,开启,即可试用
52 2018-12-09 -
一款非常全面的中文分词动态库
根据调查,各领域的信息存储约有80%包含在文本文档中,文本挖掘因此也被认为比数据挖掘具有更高的商业潜力。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web领域的挖掘技术正悄然兴起
19 2019-07-13 -
elasticsearch的IK分词器安装包
elasticsearch的中文分词器,IK分词器支持中文分词,也支持英文分词,还支持相似分词,动态加载分词库
35 2020-04-28 -
elasticsearch的mmseg分词器安装包
elasticsearch的中文分词器,mmseg分词器支持中文分词,也支持英文分词,维语分词,可以联系发布者,了解如何支持维语分词
12 2020-08-22 -
solr ik分词器需要的jar包
solr需要的IK分词jar包,研究使用solr版本为solr6.0
24 2019-05-02 -
mmseg4j中文分词器
mmseg4j中文分词器
16 2020-09-24 -
Jcseg中文分词器v2.6.2
为您提供Jcseg中文分词器下载,Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器
8 2020-10-03 -
ktdict lucene.net中文分词器
ktdict 中文分词器 一个开源的C#.net编写的,分词准确率大于90%,分词速度非常快,支持人名识别,词性标注,词频判断,未登录词识别,字典管理,Lucene.net接口
19 2020-09-27 -
中文分词器JEAnalysis1.5.3.ja
JE分词器,在基于Lucene搜索引擎中很常用,主要是针对中文
18 2020-02-17
暂无评论