汉语自动分词和命名实体识别
该资源对命名实体识别和自动分词技术进行了研究。命名实体识别是信息提取、问答系统、句法分析、机器翻译、面向SemanticWeb的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。
用户评论
推荐下载
-
论文研究命名实体识别和指代消解在文摘系统中的应用.pdf
介绍了一个基于句子抽取的单文档自动文摘系统,在该系统基础上应用了命名实体识别和指代消解技术,最后通过人工评价和自动评价结果讨论命名实体识别和指代消解对文摘系统的贡献。
15 2020-06-11 -
NeuroNER使用神经网络的命名实体识别易于使用和最新结果源码
神经NER NeuroNER是执行命名实体识别(NER)的程序。 网址: 。 该页面提供了安装和使用NeuroNER的分步说明。 目录 要求 NeuroNER依赖于Python 3,TensorFlo
5 2021-02-06 -
msra命名实体语料BIO schema.zip
2006年,微软亚洲研究院(Microsoft Research Asia, MSRA)发布的BIO格式标注语料,共计46365条。
14 2021-04-20 -
随机条件场域命名实体抽取ppt
我做的 随机条件场 域 命名实体抽取的ppt。
36 2019-01-02 -
CRFbilatm中文实体命名识别
CRF+bilatm 中文实体命名识别, 支持python3,使用的是1998年人民日报标注数据
40 2019-01-12 -
一种面向微博文本的命名实体识别方法
命名实体识别是自然语言处理领域的一项基础性技术。近年来微博等网络社交平台发展迅速,其独特的形式对传统的命名实体识别技术提出了新的挑战。故提出一种基于条件随机场模型的改进方法,针对微博文本短小、语义含糊
5 2020-10-27 -
Python用于训练命名实体识别的监督分类器的数据集
用于训练命名实体识别的监督分类器的数据集
33 2020-05-23 -
中文电子病历命名实体识别的主动学习方法研究
主动学习通过选择现有模型中未充分训练的数据进行迭代训练,从而利用少量标注数据训练出较高性能的模型。 传统的主动学习方法只关注数据本身的信息量而忽略了该数据是否孤立。论文提出一种改进的主动学习方法,利用
30 2019-01-12 -
中文命名实体识别语料MSRA加人民日报加Boson
适合作为命名实体识别的补充预料,包括微软亚研院MSRA:46365条语料、人民日报:23061条语料和Boson:2000条语料。都是标注过的,非常实用,适合新手作为刚开始的模型练习。
84 2020-06-08 -
PythonCCKS2017中文电子病例命名实体识别项目
主要实现使用了基于字向量的四层双向LSTM与CRF模型的网络.该项目提供了原始训练数据样本(一般醒目,出院情况,病史情况,病史特点,诊疗经过)与转换版本,训练脚本,预训练模型,可用于序列标注研究.把玩
37 2020-05-25
暂无评论