国家语委人工词性标注语料
词性标注按照国家语委词性标注集,编码为utf-8,未进行分句。
用户评论
推荐下载
-
论文研究面向中文出院小结的语料标注研究.pdf
面向中文出院小结的语料标注研究,赵成龙,邹仕洪,命名实体识别NER(Named Entity Recognition)是自然语言处理NLP(natural language processing)领域
17 2020-07-17 -
1998年人民日报POS标注语料
1998年人民日报词性标注语料,可用来进行分词,词性标注,命名实体识别工作。
55 2018-12-18 -
现代哈萨克语词级标注语料库的构建研究
现代哈萨克语词级标注语料库的构建研究
11 2021-02-23 -
论文研究基于粗分和词性标注的中文分词方法.pdf
中文分词是中文信息处理的重要内容之一。在基于最大匹配和歧义检测的粗分方法获取中文粗分结果集上,根据隐马尔可夫模型标注词性,通过Viterbi算法对每个中文分词的粗分进行词性标注。通过定义最优分词粗分的
29 2020-05-14 -
有关词性标注及中文人名机构名识别的源代码
一个集分词、词性标注和依存句法分析的强大的工具包,能够帮助你识别中文人名、机构名。
21 2020-06-03 -
论文研究领域自适应的合成词词性标注研究.pdf
在词性标注研究中,未登录的专业领域合成词给词性标注增加了很大的困难。提出了一种领域自适应的合成词词性标注方法,融合支持向量机(SVM)模型和基于转换学习(TBL)的方法来进行自动词性标注。对专业领域合
20 2020-07-17 -
字词频统计和切分词工具词性标注工具用于分词管理
字词频统计和切分词工具(词性标注工具,用于分词管理),两个工具,支持单文件和目录处理。
28 2019-05-25 -
BiLSTM POS Tagger基于双向LSTM网络PyTorch的词性标注器源码
BiLSTM-POS-Tagger 基于双向LSTM网络(PyTorch)的词性标注器 要训练网络,请使用rnn_train.py(确保提供带标签的数据集) 要加载网络并标记句子,请使用rnn_a
29 2021-05-08 -
论文研究基于分词与词性标注的汉语逗号自动分类.pdf
近年来,标点符号作为篇章的重要部分逐渐引起研究者的关注。然而,针对汉语逗号的研究才刚刚展开,采用的方法也大多都是在句法分析的基础上,尚不存在利用汉语句子的表层信息开展逗号自动分类的研究。提出了一种基于
32 2020-07-19 -
Penn_Treebank_tag_set corenlp英文全部词性标注含义及标签
corenlp中的词性标注缩写含义使用的是Penn Treebank tag set,这是全部对应缩写的含义,这份资源下载自https://www.eecis.udel.edu/~vijay/cis8
17 2020-07-26
暂无评论