1.1实验目的• 理解mapreduce算法思想与流程• 应用mapreduce思想解决wordCount问题• 可选掌握并应用combine与shuffle过程.1.2实验内容提供9个预处理过的源文件source0109模拟9个分布式节点每个源文件中包含一百万个由英文数字和字符不包括逗号构成的单词单词由逗号与换行符分割.要求应用mapreduce思想模拟9个map节点与3个reduce节点实现wordCount功能输出对应的map文件和最终的reduce结果文件.由于源文件较大要求使用多线程来模拟分布式节点.学有余力的同学可以在mapreduce的基础上添加combine与shuffle过程并可以计算线程运行时间来考察这些过程对算法整体的影响.提示实现shuffle过程时应保证每个reduce节点的工作量尽量相当来减少整体运行时间.1.3实验过程