一种面向大数据分析的快速并行决策树算法(网络在线培养研究生成果)

babywhy 3 0 PDF 2021-02-10 01:02:23

为了提高基于大规模数据的决策树训练效率提出了一种基于Spark平台的并行决策树算法 (SPDT). 首先,采用数据按列分区的方法,该方法把单个属性列完整地保留在一个分区内,使缓存该分区数据的数据节点能独立完成信息熵的计算,以减少数据节点之间的信息交流造成的网络资源的占用. 然后,数据在按列分区后以稠密向量的形式缓存于内存中,SPDT对数据进行压缩,以减少对内存的占用. 最后,SPDT采用基于边界点类别判定的连续属性离散化方法来处理连续属性,减少决策树训练过程中信息熵计算的频次, 并提出使用信息增益比来划分训练数据集的方法,以减少信息增益计算对多属性值属性的依

资源预览

用户评论

暂无评论

决策树算法基础1

决策树算法评价准确性,速度,强壮行,规模性,可解释性什么是决策树(Decision tree)? 类似于流程图的树结构:其中,每个内部节点表示在一个属性上的测试,每个分支代表一个属性输出,而每个

8 2021-01-14
机器学习决策树算法

决策树概念决策树(Decision Tree)是一种基本的分类与回归方法,本文主要讨论分类决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规

30 2021-01-16
分类决策树算法.ppt

分类决策树算法.ppt

19 2020-12-16
决策树算法实战过程

压缩包包含数据和代码，代码有详细的算法分析过程。算法使用的是c5.0决策树模型。分析过程重在建模和模型提升。

27 2019-08-17
决策树分类算法原理

文档为pdf格式，详细描述了决策树算法原理及相关例子说明。

27 2020-04-14
决策树算法详细介绍

决策树算法是非常有用的一类算法。在数据挖掘中有着不可估量的作用。

20 2019-09-09
决策树算法C实现

决策树算法ID3实现，带有训练数据和测试数据。可以打印出构建的决策树。

30 2019-01-11
决策树改进算法课件

本课件对决策树算法进行改进，简明扼要的阐述了id3算法的具体内容，是高校教学有一定的借鉴指导作用

29 2019-01-21
决策树算法原理详解

决策树是一种常用的机器学习算法，本文将详细介绍其原理及应用。首先介绍了决策树的基本概念：节点、分支、叶子节点以及决策过程。接着讲解了决策树的三种构建方法：ID3、C4.5和CART。同时，本文还介绍了

10 2023-04-15
决策树算法及实现

在计算机科学中,树是一种很重要的数据结构,比如我们最为熟悉的二叉查找树(Binary SearchTree),红黑树(Red-BlackTree)等,通过引入树这种数据结构,我们可以很快地缩小问题规模

15 2021-02-01

一种面向大数据分析的快速并行决策树算法(网络在线培养研究生成果)

资源预览

用户评论

推荐下载