Hadoop构建数据仓库实践.pdf
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和
用户评论
推荐下载
-
数据仓库实践杂谈十四数据模型参考
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:
7 2021-01-09 -
基于Hadoop的企业数据仓库建设与创新
Construction and Innovation of Enterprise Data Warehouse Based on Hadoop
23 2019-06-23 -
第14章基于Hadoop的数据仓库Hive
本章首先介绍了数据仓库的概念、Hive的基本特征、与其他组件之间的关系、与传统数据库的区别以及它在企业中的具体应用;接着详细介绍了Hive的系统架构,包括基本组成模块、工作原理和几种外部访问方式,描述
36 2018-12-27 -
数据仓库与数据挖掘实践.pdf中文高清完整版
《数据仓库与数据挖掘实践》系统地介绍了数据仓库和数据挖掘技术,全本由两部分组成,第1章到第3章介绍数据仓库的基本概念和相关技术,第4章到第11章介绍数据挖掘的基本概念和各种算法,包括数据仓库构建、OL
43 2019-05-16 -
数据仓库建模与ETL实践技巧重要
构建企业级数据仓库的流程!构建企业级数据仓库五步法;
23 2019-05-15 -
数据仓库建模与ETL的实践技巧
Data仓库(DataWarehouseDW)是为了便于多维分析和多角度展现而将Data按特定的模式进行存储所建立起来的关系型Datcbase,它的Data基于OLTP源Systam。Data仓库中的
18 2019-07-26 -
数据仓库之路数据仓库方法论
数据仓库方法论,从理论上描述了怎么构建数据仓库,希望对你有所帮助。第一次上传,见谅啊。
35 2019-09-15 -
数据仓库与OLAP技术数据仓库实现
数据仓库技术是随着人们对大型数据库系统研究的不断深入,在传统数据库技术基础之上发展而来的,其主要目的就是为决策提供支持,为OLAP、数据挖掘深层次的分析提供平台。
28 2019-09-09 -
数据仓库教程
数据仓库的电子教程。pdf格式本书论述在设计和建造数据仓库中涉及的所有主要问题,论述分析型环境(决策支持系统环境)以及在这种环境中的数据构造。主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的
6 2020-12-20 -
数据仓库基础.
数据仓库基础....
14 2020-09-17
暂无评论