UCI数据集中的几个Large-scale大规模分类建模数据,名称为SUSY、HIGGS,用以测试分类算法的时间和空间复杂度。
暂无评论
UCI Wine 数据集是机器学习标准的公用数据集
Python processing UCI abalone data set
优质的uci数据集 适合在搞机器学习和数据挖掘的同学使用哈~包含的数据集文件举例:abalone balance-scale bcw-wdbc bcw-wpbc blood-transfusion b
UCI数据集A-Z都是arff格式的很全的哦
UCI Germny Credit 数值型数据集独立测试数据,按70%比例抽取,剩余30%独立测试。 UCI Germny Credit 数值型数据集独立测试数据.csv
该数据库包含76个属性,但是所有已发布的实验都引用了其中14个属性的子集。特别是,克利夫兰数据库是 迄今为止ML研究人员使用的唯一数据库。“目标”字段是指患者中心脏病的存在。 heart.csv
此文件为数据挖掘分类实验数据集,内含说明文档,没有压缩密码
皮马人糖尿病数据集(UCI)-数据集
PQk-means一个用于大规模数据高效集群的Python库
针对目前缺少大型数据分析框架间的横向比较问题,使用有代表性的大数据工作负载,对Hadoop、Spark和Flink进行性能和可扩展性等因素的比较评价。此外,通过调整工作负载的一些主要参数,例如HDFS
暂无评论