葡萄牙语母语识别数据集

anzuguigui 31 0 PDF 2020-12-17 03:12:17

在本文中,我们介绍NLI-PT,它是为母语识别(NLI)编译的第一个葡萄牙语数据集,它根据第二语言写作来识别作者的第一语言。该数据集包括由欧洲葡萄牙语学习者撰写的1868篇学生散文,其母语为以下L1:中文,英文,西班牙文,德文,俄文,法文,日文,意大利文,荷兰文,德顿文,阿拉伯文,波兰文,韩文,罗马尼亚文, 和瑞典语。 NLI-PT包括原始学生文本和四种不同类型的注释:POS,细粒度POS,选区分析和依赖分析。 NLI-PT不仅可以用于NLI,还可以用于第二语言习得和教育NLP领域的几个主题的研究。我们讨论了这个数据集的可能应用,并展示了葡萄牙语NLI的第一个词汇基线系统的结果。

用户评论

暂无评论

字母识别数据集以及标签.zip

字母识别所用的数据集,图像大小是28*28的,a-z,训练集10万+,测试集4000张,里面用matlab写了标签生成的方法,可以根据自己的需要测试的提取数据,自己生成标签。

37 2020-09-03
kNN分类算法手写识别数据集

kNN分类算法手写识别数据集

40 2020-09-01
AR人脸识别数据集已分类

经典的AR人脸识别数据集。100人,每人26张,已分类,jpg格式,灰度图,像素165x120。分为正常、墨镜遮挡、围巾遮挡、光照变化、表情变化等情况。

30 2020-08-17
Python行人重识别数据集汇总

Collectionofpublicavailablepersonre-identificationdatasets

32 2020-05-17
人脸检测人脸识别数据集.txt

1、FDDB；2、IMDB-WIKI；3、CASIA-3DFaceV1；4、TheCNBCFaceDatabase；5、CASIA-FaceV5；6、YouTubeFaces；7、CMUVASC_PI

60 2020-06-10
文本识别数据集IIIT.zip

文本识别数据集：IIIT训练集2000张测试集3000标签中都是每张图片上对应的单词train.txt和test.txt都是过滤之后的标签（去掉符号和小于3个字符的）另外两个标签是原版标签没有进

16 2020-05-27
CK加人脸表情识别数据集

人脸表情识别数据集

97 2020-12-05
命名实体识别数据集.rar

该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下: 以 O

46 2020-11-06
人脸表情识别数据集CK加

人脸8种动态彩色表情数据集，包括123个subjects,593个imagesequence，每个imagesequence的最后一张Frame都有actionunits的label，而在这593个i

44 2019-09-05
手写数字字母识别数据集

如今网络上高质量的手写数字与字母数据集较难收集,且多为图片格式,数据量大,下载困难。本数据集精选高质量手写数字与字母图片,将图片矩阵(大小为28*28)转化为列表格式,与其标签并入csv文件中。每一类

53 2020-08-29

葡萄牙语母语识别数据集

用户评论

推荐下载