葡萄牙语母语识别数据集
在本文中,我们介绍NLI-PT,它是为母语识别(NLI)编译的第一个葡萄牙语数据集,它根据第二语言写作来识别作者的第一语言。 该数据集包括由欧洲葡萄牙语学习者撰写的1868篇学生散文,其母语为以下L1:中文,英文,西班牙文,德文,俄文,法文,日文,意大利文,荷兰文,德顿文,阿拉伯文,波兰文,韩文,罗马尼亚文, 和瑞典语。 NLI-PT包括原始学生文本和四种不同类型的注释:POS,细粒度POS,选区分析和依赖分析。 NLI-PT不仅可以用于NLI,还可以用于第二语言习得和教育NLP领域的几个主题的研究。 我们讨论了这个数据集的可能应用,并展示了葡萄牙语NLI的第一个词汇基线系统的结果。
用户评论
推荐下载
-
字母识别数据集以及标签.zip
字母识别所用的数据集,图像大小是28*28的,a-z,训练集10万+,测试集4000张,里面用matlab写了标签生成的方法,可以根据自己的需要测试的提取数据,自己生成标签。
37 2020-09-03 -
kNN分类算法手写识别数据集
kNN分类算法手写识别数据集
40 2020-09-01 -
AR人脸识别数据集已分类
经典的AR人脸识别数据集。100人,每人26张,已分类,jpg格式,灰度图,像素165x120。 分为正常、墨镜遮挡、围巾遮挡、光照变化、表情变化等情况。
30 2020-08-17 -
Python行人重识别数据集汇总
Collectionofpublicavailablepersonre-identificationdatasets
32 2020-05-17 -
人脸检测人脸识别数据集.txt
1、FDDB;2、IMDB-WIKI;3、CASIA-3DFaceV1;4、TheCNBCFaceDatabase;5、CASIA-FaceV5;6、YouTubeFaces;7、CMUVASC_PI
60 2020-06-10 -
文本识别数据集IIIT.zip
文本识别数据集:IIIT训练集2000张测试集3000标签中都是每张图片上对应的单词train.txt和test.txt都是过滤之后的标签(去掉符号和小于3个字符的)另外两个标签是原版标签没有进
16 2020-05-27 -
CK加人脸表情识别数据集
人脸表情识别数据集
97 2020-12-05 -
命名实体识别数据集.rar
该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下: 以 O
46 2020-11-06 -
人脸表情识别数据集CK加
人脸8种动态彩色表情数据集,包括123个subjects,593个imagesequence,每个imagesequence的最后一张Frame都有actionunits的label,而在这593个i
44 2019-09-05 -
手写数字字母识别数据集
如今网络上高质量的手写数字与字母数据集较难收集,且多为图片格式,数据量大,下载困难。本数据集精选高质量手写数字与字母图片,将图片矩阵(大小为28*28)转化为列表格式,与其标签并入csv文件中。每一类
53 2020-08-29
暂无评论