NER中文语料集.zip
整合格式为:字BIO标签格式,可以直接使用主流NER模型进行训练
用户评论
推荐下载
-
NLP文本分类语料库复旦训练集
由复旦大学李荣陆提供。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。train.zip为训练语料,共9804篇文档,分为20
69 2019-05-31 -
bert数据集MSPC语言学语料库
bert数据集MSPC,语言学语料库是一种用于自然语言处理任务的数据集,其中包含了大量的语言学语料。这个数据集被广泛应用于机器翻译、语义分析、情感分析等各种自然语言处理任务中。它可以帮助研究人员和开发
52 2023-10-17 -
BOTSALLY® 赛莉®中文语料自动标注细切词性标注语料样例
赛莉®中文语料自动标注 https://www.botsally.tech 更多的语料资源,请到标注语料下载页面下载,语料的下载仅用于科研实验,商业应用请购买版权。
18 2020-07-21 -
复旦大学文本分类新闻语料测试集加训练集
编码格式为GBK。 是网上流传的测试集和训练集的合并版。 用户获取后要自行清洗语料。
64 2018-12-08 -
垃圾短信中文数据集.zip
含80万条带标注中文短信(其中1表示垃圾短信,0表示正常短信);20万条不带标注的中文短信;参考链接:https://github.com/hrwhisper/SpamMessage
34 2020-06-11 -
中文命名实体识别ner数据_resume_bio格式
中文命名实体识别ner数据_resume_bio格式已经清理干净,放心下载,直接可以用各种ner模型训练
29 2020-05-19 -
分词库和语料库.zip
人民日报2014语料库和很多行业的中文分词库,如财经,地点,电视剧,电影等。如果有需要的可以在此处下载哦。
23 2020-05-19 -
人民日报2014语料.zip
2014年的人民日报数据,总共有28万行,可直接做词性标注训练使用,处理后也可以做实体识别模型训练用。
16 2020-05-15 -
casia汉语情感语料库.zip
该数据库(http://www.chineseldc.org/resource_info.php?rid=76)由中国科学院自动化研究所录制,由4位录音人(2男2女)在纯净录音环境下(信噪比约为35d
34 2020-06-20 -
机器人语料库.zip
机器人对话语料库,苦苦收集而来,希望可以帮助大家,谢谢支持
99 2019-09-25
暂无评论