这份数据集包含了逾5万条高质量的中文命名实体识别数据,采用了IOB2格式,并符合CoNLL 2002和CRF++的标准。数据集覆盖了多个领域的文本,包括新闻、社交媒体、科技和医疗等。其中包含了人名、地名和机构名等不同类型的命名实体。数据集的标注精确度很高,非常适合用于中文命名实体识别模型的训练和评估。该数据集针对自然语言处理研究者、机器学习爱好者、数据科学家以及人工智能从业者等多个人群群体而设计。此数据集可用于训练和评估中文命名实体识别模型,有助于提高中文命名实体识别模型的准确性和效率。适用场景和目标:该数据集可应用于中文命名实体识别任务的训练和评估,例如实体抽取、实体链接和关系抽取等。通过利用该数据集,可以有效提升中文命名实体识别模型的准确性和效率,为自然语言处理和人工智能领域的研究和应用提供支持。其他说明:此数据集是免费开放资源,无论个人还是机构都可以免费使用。该数据集源自多个公开数据集和网站,并经过人工标注和清洗,以确保数据的质量和准确性。同时,我们还提供了详尽的数据说明和使用指南,以帮助用户快速上手。
高质量的中文命名实体识别数据集IOB2格式符合CoNLL2002和CRF标准
用户评论
推荐下载
-
pytorch bert crf ner KoBERT的CRF로개체명인식기 基于BERT加CRF的韩文命名实体识别模型源码
pytorch-BERT-CRF-NER 基于BERT + CRF的朝鲜语NER Tagger的PyTorch实现(PyTorch v1.2 / Python 3.x) 例子 日志 문장을 입력하세요
22 2021-04-04 -
高质量C语言高质量C
高质量C课程介绍 高质量C课程详解 高质量C课程内容
33 2019-01-15 -
口罩识别数据集备份2
口罩识别数据集备份2
22 2020-07-18 -
DeepNER天池中药说明书实体识别挑战冠军方案中文命名实体识别NER BERT CRF BERT SPAN BERT MRC Py
中文-DeepNER-Pytorch 天池中药说明书实体识别挑战冠军方案开源 贡献者: zxx飞翔的鱼: : 我是蛋糕王: : 数青峰: : 后续官方开放数据集后DeepNER项目会进行优化升级,
56 2021-04-26 -
电子病历命名实体识别和实体关系抽取研究综述杨锦锋
电子病历(Electronicmedicalrecords,EMR)产生于临床治疗过程,其中命名实体和实体关系反映了患者健康状况,包含了大量与患者健康状况密切相关的医疗知识,因而对它们的识别和抽取是信
26 2019-07-14 -
将丰富的背景知识用于基因命名实体的分类和识别
背景:基因命名实体的分类和识别是生物医学文献中文本挖掘的关键性初步步骤。 基于机器学习的方法已在这一领域获得了巨大成功。 在大多数最新系统中,精心设计的词汇功能(例如单词,n-gram和形态模式)已发
2 2021-02-24 -
命名实体关系抽取技术
此文档为博士论文,全面介绍了对中文自然语言进行处理的一些技术
53 2019-01-21 -
nlp命名实体识别Named Entity Recognition NER demo
nlp命名实体识别NamedEntityRecognitionNERdemo1.制作word和tag的dic,dic的id是0开始的int,出现频率高的排在前面2.将每一句话转成2个80维的向量
26 2020-06-19 -
Named Entity Recognition app命名实体识别应用源码
Named-Entity-Recognition-app:命名实体识别应用
22 2021-04-01 -
sighan2006MSRA命名实体语料BIO格式
2006年sighan命名实体识别任务语料,MSRA提供。已经转成BIO格式,可直接用于NER训练
33 2019-04-28
暂无评论