Hadoop是一个分布式系统基础框架,它的核心部分是HDFS和MapReduce。HDFS是基于流数据访问模式的分布式文件系统,支持海量数据的存储;MapReduce是分布式并行编程模型,用于进行大数据量的计算。