、hadoop的组成hadoopCommon–是hadoop的核心,包括文件系统、远程调用RPC的序列化函数。HDSF:提供高吞吐量的可靠分布式文件系统是GFS的开源实现。•Hadoop的文件系统。必须通过hadoopfs命令来读取。支持分布式。MapReduce:大型分布式数据处理模型,是GoogleMapReduce的开源实现。•合并/计算模型。其他相关组成:•Hbase:结构化分部式数据库。BigTable的开源实现。•Hive:提供摘要和查询功能的数据仓库。•Cassandra:由Facebook开发分布式数据仓库。目前已经捐献给apache。且apache已经将Cassandra应用到了各种云计算系统