计算所汉语词法分析系统ICTCLAS

面壁者韩晨 81 0 RAR 2018-12-09 11:12:18

词是最小的能够独立活动的有意义的语言成分,但汉语是以字为基本的书写单位，词语之间没有明显的区分标记，因此，中文词法分析是中文信息处理的基础与关键。为此,中国科学院计算技术研究所在多年研究基础上，耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，该系统的功能有：中文分词；词性标注；未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果)，基于角色标注的未登录词识别能取得高于90%召回率，其中中国人名的识别召回率接近98%，分词和词性标注处理速度为543.5KB/s。计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll,COM组件和相应的概率词典,开发者可以完全忽略汉语词法分析，直接在自己的系统中调用ICTCLAS，ICTCLAS可以根据需要输出多个高概率的结果，输出格式也可以定制，开发者在分词和词性标注的基础上继续上层开发。使用时请遵守《自然语言处理开放资源许可证》

文件列表

ICTCLAS V1.2.rar (预估有个53文件)

Codes and ApplicationV1.2

ICTCLAS_WIN.opt 52KB

Utility

Utility.cpp 25KB

ContextStat.h 3KB

Dictionary.h 6KB

Utility.h 7KB

ContextStat.cpp 8KB

Dictionary.cpp 37KB

ICTCLAS_Win.clw 2KB

res

ICTCLAS_Win.rc2 403B

ICTCLAS_Win.ico 1KB

Thumbs.db 3KB

ICTCLAS_Win.dsp 6KB

ICTCLAS_WinDlg.h 2KB

ICTCLAS_Win.aps 38KB

ICTCLAS_WIN.sln 79B

Result

Result.h 3KB

Result.cpp 25KB

ICTCLAS_WIN.cpp 3KB

log.txt 39KB

Tag

Span.h 4KB

Span.cpp 29KB

ICTCLAS_WIN.dsw 545B

StdAfx.cpp 831B

ICTCLAS_WIN.suo 6KB

resource.h 1KB

Unknown

UnknowWord.h 3KB

UnknowWord.cpp 5KB

ICTCLAS_WinDlg.cpp 12KB

ICTCLAS_WIN.h 2KB

StdAfx.h 2KB

Segment

Segment.h 3KB

NShortPath.h 2KB

Segment.cpp 22KB

Queue.cpp 3KB

DynamicArray.cpp 10KB

Queue.h 3KB

DynamicArray.h 3KB

SegGraph.cpp 17KB

SegGraph.h 3KB

NShortPath.cpp 8KB

ICTCLAS_WIN.ncb 153KB

ICTCLAS_Win.plg 3KB

ICTCLAS_Win.rc 8KB

ReadMe.txt 4KB

Data

BigramDict.dct 7.19MB

tr.dct 63KB

ns.ctx 408B

nr.ctx 1KB

ns.dct 53KB

nr.dct 111KB

tr.ctx 408B

lexical.ctx 10KB

coreDict.dct 1.49MB

用户评论

weixin_68537 2018-12-09 11:12:18

虽然版本旧了点但是对于理解分词的原理有帮助

azhu7 2018-12-09 11:12:18

不会用，学学吧

你粼哥 2018-12-09 11:12:18

不错，可是版本有些老了。

TXT格式现代汉语词典

这是个TXT格式的《现代汉语词典》，推荐收藏！

100 2019-05-03
千万级巨型汉语词库目录.zip

一份海量的汉语词库表,挺不错的

18 2021-04-14
近7万汉语词典汉语辞典ACCESS数据库

共有记录68311条记录，解释也很详细，包含不同出处不同解释。

0 2024-09-05
英语词根词缀构词法

学习英语,最难之一主是单词.英语词根,词缀,能更容易的记住单词,这里包括了4级的单词词根,词缀.

17 2019-05-19
论文研究基于主观倾向性的汉语词聚类分析.pdf

基于主观倾向性的汉语词聚类分析，曹特磊，吴云，词聚类是语言自动处理中一个重要的基础环节。目前,针对汉语词聚类的方法大多集中在根据词语的相似性分析来进行的。这里的相似性��

17 2020-03-04
论文研究基于句法分析的汉语词义消歧.pdf

为了提高词义消歧的质量，对歧义词汇的上下文进行结构分析，提出了一种利用句法知识来指导消歧过程的方法。在歧义词汇上下文的句法树中，提取句法信息和词性信息作为消歧特征；同时，使用朴素贝叶斯模型作为消歧分类

25 2020-07-20
词法分析java版词法分析

Java编写的词法分析器（可自己定义关键字）

29 2019-01-11
词法分析器词法分析

词法分析器词法分析词法分析程序 C++

47 2019-01-22
model.zip中科院计算所SeetaFace2算法训练模型

SeetaFace2采用标准C++开发，全部模块均不依赖任何第三方库，支持x86架构（Windows、Linux）和ARM架构（Android）。SeetaFace2支持的上层应用包括但不限于人脸门禁

21 2019-09-29
中科院计算所培训中心高级系统架构师培训资料PDF

中科院计算所培训中心高级系统架构师培训资料PDF

36 2019-09-21

计算所汉语词法分析系统ICTCLAS

文件列表

用户评论

推荐下载