mapreduce复习资料,供学习下载1.文件处理1 2.概要模式2 2.1数值概要2 2.1.1最大值最小值与计数2 2.1.2平均值6 2.1.3中位数与标准差10 2.2倒排索引概要14 2.3计数器计数17 3.过滤模式21 3.1过滤21 3.1.1分布式grep21 3.1.2简单随机抽样SRS22 3.2布隆过滤24 3.3TOP1028 4.数据组织模式32 4.1分层32 4.2分区37 4.3分箱41 4.4全排序43 4.5混排47 5.连接模式50 5.1Reduce端连接51 5.