本书从Hadoop 的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop 这-高性能处理海量数据集的理想工具。全书共16 章, 3 个附录,涉及的主题包括: Haddoop 简介; MapReduce 简介; Hadoop 分布式文件系统; Hadoop 的ν0 、MapReduce 应用程序开发; MapReduce 的工作 机制; MapReduce 的类型和格式; MapReduce 的特性:如何构建Hadoop 集群,如何管理Hadoop等内容