Hadoop是apache的开源项目,开发的主要目的是为了构建可靠,可拓展scalable,分布式的系统,hadoop是一系列的子工程的总和,其中包含1.hadoopcommon:为其他项目提供基础设施2.HDFS:分布式的文件系统3.MapReduce:Asoftwareframeworkfordistributedprocessingoflargedatasetsoncomputeclusters。一个简化分布式编程的框架。4.其他工程包含:Avro(序列化系统),Cassandra(数据库项目)等