-使用Hadoop进行数据存储和建模的着眼点和思路, -将数据输入、输出系统的最佳方案, -MapReduce、Spark和Hive等数据处理框架介绍, -数据去重、窗口分析等常见Hadoop处理模式应用, -在Hadoop上采用Giraph、GraphX等图形处理工具, -综合使用工作流以及Apache Oozie等调度工具, -以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理, -点击流分析、欺诈检验和数据仓库的架构案例, 本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生