KBExtraction:采用分词技术进行知识提取

morning81416 6 0 zip 2024-10-08 00:10:04

Ansj中文分词

这是一个基于Google语义模型+条件随机场模型的中文分词的Java实现。分词速度达到每秒钟大约200万字左右（mac air下测试），准确率能达到96%以上。目前实现了：中文分词、中文姓名识别、用户自定义词典等功能，可以应用到自然语言处理等方面，适用于对分词效果要求高的各种项目。

建议使用最新版的Ansj_seg。如果你用的是1.x版本或2.x版本，请根据需要下载对应的版本并导入到Eclipse中，开始你的程序。

Maven配置：

在你的pom.xml中加入以下内容：


<project>

  ...

  <repositories>

    <repository>

      <id>mvn-repo</id>

      <url>http://

</url></repository></repositories></project>

文件列表

KBExtraction:采用分词技术进行知识提取 (预估有个156文件)

unstructured.dic 117B

unstructured.dic 65B

location.dic 150B

ambiguity.dic 241B

Copy of unstructured.dic 158B

Copy of default.dic 5.63MB

location.dic 84B

core.bak 3.87MB

newWordFilter.dic 9KB

new_word_freq.dic 981KB

englishLibrary.dic 523B

company.data 44KB

bootstrap.min.css 97KB

bootstrap-theme.min.css 13KB

person.dic 34KB

asian_name_freq.data 1.04MB

numberLibrary.dic 284B

jianFan.dic 27KB

bigramdict.dic 5.8MB

position.dic 156B

用户评论

暂无评论

使用Pinyin4j进行拼音分词的方法

使用Pinyin4j进行拼音分词的方法

5 2020-11-12
Python使用神经网络对英语句子进行分词

使用神经网络对英语句子进行分词

37 2019-09-07
如何进行边缘检测边缘提取对弹孔进行边缘检测

如何进行边缘检测/边缘提取（对弹孔进行边缘检测）五种边缘检测算法

23 2020-05-17
图像利用算子进行边缘提取后进行边缘细化的算法

像利用算子进行边缘提取后进行边缘细化的算法

31 2019-05-27
tmpls技术ptn采用的技术之一

（传送网和接入网技术工作委员会-传送网工作组）研究单位：上海贝尔阿尔卡特股份有限公司、中兴通讯股份有限公司、信息产业部电信研究院、华为技术有限公司、武汉邮电科学研究院、中国电信集团公司、UT斯达康（重

16 2019-07-14
中文分词论文转载中文分词算法中文分词系统

中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解

42 2020-05-15
alice加入ik分词中文空格分词hanlp语义分词

Alice joins ik participle, Chinese space participle, hanlp semantic participle

51 2019-06-22
利用数字图像处理进行边缘提取

运用数字图像处理技术进行图像的平滑,去噪,边缘提取等

8 2021-01-02
Python进行特征提取的示例代码

#过滤式特征选择 #根据方差进行选择,方差越小,代表该属性识别能力很差,可以剔除 from sklearn.feature_selection import VarianceThreshold x=[

19 2021-02-01
matlab开发用徒手法进行区域提取

matlab开发-用徒手法进行区域提取。投资回报率

14 2020-08-18

KBExtraction:采用分词技术进行知识提取

文件列表

用户评论

推荐下载