【1】MapReduce概述

qms48266 17 0 PDF 2021-01-29 14:01:57

1.定义 MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的 数据分析应用”的核心框架。 MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。 2.优缺点 优点: (1)MapReduce易于编程 (2)良好的扩展性 (3)高容错性 (4)适合PB级别以上海量数据的离线处理 缺点: (1)不擅长实时计算 (2)不擅长流式计算(MapReduce的输入数据集是静态的) 3.MapReduce核心思想 分析WordCount 数据流走向深入理解MapReduce 核心思想。 4.MapR

用户评论
请输入评论内容
评分:
暂无评论