深入理解大数据 大数据处理与编程实践.pdf(中文高清版)
本书在总结多年来MapReduce并行处理技术课程教学经验和成果的基础上,与业界著名企业Intel公司的大数据技术和产品开发团队和资深工程师联合,以学术界的教学成果与业界高水平系统研发经验完美结合,在理论联系实际的基础上,在基础理论原理、实际算法设计方法以及业界深度技术三个层面上,精心组织材料编写而成。全书的主要内容包括:■ 大数据处理技术与HadoopMapReduce简介■ Hadoop系统的安装和操作管理■ 大数据分布式文件系统HDFS■ HadoopMapReduce并行编程模型、框架与编程接口■ 分布式数据库HBase■ 分布式数据仓库Hive■ IntelHadoop系统优化与功能增强■ MapReduce基础算法程序设计