市面上第一本关于Hadoop与Spark大数据处理技巧的教程,提供了丰富的算法和工具。作者简介MahmoudParsian,计算机科学博士,是一位热衷于实践的软件专家,作为开发人员、设计人员、架构师和作者,他有30多年的软件开发经验。目前领导着Illumina的大数据团队,在过去15年间,他主要从事Java(服务器端)、数据库、MapReduce和分布式计算的有关工作。Mahmoud还著有《JDBCRecipes》和《JDBCMetadata,MySQL,andOracleRecipes》等书(均由Apress出版)。目录序1前言3第1章二次排序:简介19二次排序问题解决方案21MapReduce/Hadoop的二次排序解