并行数据库架构及Teradata Greenplum特性分析 随着数据规模越来越大,诸如Oracle、DB2等传统型数据库越来越难以满足对大数据量的分析,而面向数据仓库的Teradata、Greenplum等并行数据库却火了起了。本材料介绍并行数据库基本原理及架构,并以市场上最热的Teradata、Greenplum并行数据库为例进行分析,希望能窥出大数据分析
决策树算法 决策树算法为机器学习领域最经典算法之一,本课件以1个案例引入决策树算法在日常工作中的应用,之后通过示例详细介绍决策树算法的核心概念信息熵的应用,系统介绍ID3算法,并以Python语言加以实现。