一种用于大规模数据集的决策树采样策略
为提高大规模数据集生成树的准确率,提出一种预生成一棵基于这个数据集的决策树,采用广度优先遍历将其划分为满足预定义的限制的数据集,再对各数据集按照一定比例进行随机采样,最后将采样结果整合为目标数据集的数据采样方法。通过对一UCI数据集进行采样,并用现有决策树算法实验证明,该采样方法优于传统随机采样方法,基于该采样方法的生成树准确率有所提高。
用户评论
推荐下载
-
论文研究一种基于分类规则树和信息熵的决策树构造方法.pdf
一种基于分类规则树和信息熵的决策树构造方法,刘宁,,随着网络技术和硬件技术的发展,面临数据的海量增长,数据规模由于过于庞大不便于存储,这对传统分类算法提出了挑战。为此,文中
8 2020-06-19 -
全球大规模数据中心的加速创新
云计算以及大数据推动了存储市场的增长。超大规模数据中心所需要的是能满足多种商业模式(可以是SaaS,PaaS或IaaS)以及应用的存储架构,而国内的互联网巨头正通过采用创新方案引领发展潮流。全球的下一
28 2020-06-11 -
数据挖掘之决策树算法
决策树算法,使用Visualstudio2010编译通过,低版本Visualstudio应该也可以编译。
31 2019-09-09 -
数据挖掘决策树算法扩展
数据挖掘算法决策树算法及其在广泛领域的应用与扩展。
7 2024-04-27 -
决策树代码使用的是周志华西瓜的数据集
决策树代码(使用的是周志华西瓜的数据集),数据虽然不多,但是是自己手动整理的,如果有需要的朋友欢迎推广下载!!谢谢大家了!只需要一个积分即可!!
34 2020-11-06 -
决策树数据挖掘数据分类代码
决策树(数据挖掘数据分类)代码,其中包含了各种算法
41 2019-12-30 -
MATLAB大规模数据处理技巧.pdf
MATLAB大规模数据处理技巧.pdf
26 2020-06-10 -
大规模数据挖掘第二版
斯坦福公开课,大规模数据挖掘,2014年英文原版
21 2019-01-10 -
大规模数据与分布式计算
Large-scale data and distributed computing
22 2019-06-24 -
Matlab大规模数据处理官方教程
是matlab官方教程PPT,讲述比较粗略
18 2020-07-21
暂无评论