第一章分布式计算框架与资源调度61.1分布式计算框架61.1.1编程模型61.1.2特殊的组件partitioner与combiner111.1.3用mr进行数据的排序,然后求出topN141.1.4MapReduce求两个人的共同好友算法171.2分布式资源调度框架211.2.1yarn的概念211.2.2yarn的架构221.2.3yarn的工作流程221.2.4yarn的调度器Scheduler241.3分布式文件存储系统261.3.1架构261.3.2原理271.3.3API301.4项目451.4.1点击流日志模型451.4.2推荐系统项目