盘古分词源代码
盘古分词是一个基于.netframework的中英文分词组件。主要功能
中文未登录词识别
盘古分词可以对一些不在字典中的未登录词自动识别
词频优先
盘古分词可以根据词频来解决分词的歧义问题
多元分词
盘古分词提供多重输出解决分词粒度和分词精度权衡的问题
中文人名识别
输入:“张三说的确实在理”
分词结果:张三/说/的/确实/在理/
输入“李三买了一张三角桌子”
分词结果:李三/买/了/一张/三角/桌子/
强制一元分词
输入“张三说的确实在理”
分词结果:张(0,1)/张三(0,5)/三说的(1,1)/三(1,1)/说(2,5)/的(3,5)/确(4,1)/确实(4,5)/实(5
推荐下载
-
JAVA编写的中文智能分词源程序
用JAVA编写的中文智能源程序,用户也可以自己设置一些常用语句。对于研究搜素引擎的学者来说最适合不过了。
28 2020-05-15 -
麻将开源中文分词工具包中文分词Web APILucene中文分词中英文混合分词源码
麻将中文分词 简介 麻将一直是广受欢迎的传统娱乐活动,字牌的组合千变万化。汉字的组合也是变化多端,麻将这个项目希望能从汉字组合中发现汉语的秘密,为自然语言处理提供好的中文分词工具。 麻将是基于Scal
19 2021-04-02 -
Lucene.Net加盘古分词搜索引擎
Lucene.Net +盘古分词 搜索引擎,Lucene.Net2.9.4.版本,vs2012开发,通过实例可以有初步的认识和了解
25 2020-09-15 -
PanGu.DLL盘古分词最新版本
这是目前最新版本的Pangu分词包。里面包含:PanGu.dll盘古分词的核心组件DictManage.exe字典管理工具Demo.exe分词演示程序PanGu.HighLight.dll高亮组件
68 2020-05-15 -
Lucene3.0.3加盘古分词资源汇总
整理开发Lucene+盘古分词开发搜索引擎用到的所有必备资源亲测可用
33 2019-09-09 -
盘古分词lucene3.0.3搜索的使用示例.zip
盘古分词lucene3.0.3使用示例可以方便地整合到项目中使用,.net4.0的。
39 2019-04-30 -
C#学习之背单词源代码
利用文本读取流实现txt文件读取与数据处理,实现英文单词与中文释义的显示(正序、倒序、随机),可自定义刷新速度。
35 2019-04-11 -
vs2008c简单分词源码解决重复
给定字符串,和字典,按照字典中的词分词,如果有词重复,返回多个 比如字典中有{"abc","cd"},给定字符串abcd,则返回d,ab两个字符串。
24 2019-02-16 -
搜索引擎返回结果的分词源码
搜索引擎返回结果的分词实现源码,分词源码
34 2018-12-25 -
ICTCLAS汉语分词系统C源代码
中科院计算所的ICTCLAS汉语分词系统C源代码,在国际语言分词比赛上获奖过的
16 2020-05-15
用户评论