200类鸟类图片,已分好训练集和测试集,每一类为一个单独的文件夹;每一类图像的数量及大小可能并不相同
预测Titanic 号上的乘客生存概率,是一个二分类问题,所以我们可以使用二分类来分解。通过Spark 机器学习库中线性SVM 、Logistic回归、决策树、随机森林、梯度提升树来预测。
声明:该文件主要获取中文点触验证码所需要的训练集,主要用于研究交流,不用于任何商业行为。
根据自己设定的编码方式,进行对局过程的步数持续记录,以动子为标签,目前100步数的需要约60分钟。 手工编建四国军棋数据集csv格式
使用keras版yolov3绘制loss曲线程序。将该文件替换掉原工程中的train.py,运行即可。
数据集CoNLL-2003,这一数据集是用于测试命名实体识别的早期训练数据,文本来源是报纸新闻。英文数据eng.train
word2vec的训练语料库text8.train.txt。一个很长的字符串,用来训练词向量。文件大小大约62M。
赛题以计算机视觉中字符识别为背景,要求选手预测街道字符编码,这是一个典型的字符识别问题。 为了简化赛题难度,赛题数据采用公开数据集SVHN,因此大家可以选择很多相应的paper作为思路参考。
DataFountain上的新闻情感分类的数据集为训练集的标签
2017年5月两周内,北京40余万辆摩拜单车被30余万摩拜用户的使用情况(该开源数据来源于2017年摩拜算法挑战赛)。数据包含300余万条出行记录数据,每条的数据包含了订单号(orderid)、用户编