1、Hadoop 是什么 Hadoop是现阶段数据开发的基础,Hadoop通常是指一个更广泛的概念—-Hadoop生态圈(基于或关于Hadoop的大数据开发的各种软件环境) 是Apache公司使用Java语言编写的开源的,分布式系统的基础架构 分布式就是,当储存数据很多很大时,一台机器储存不了时,需要将数据切成块,使用多台计算机分布式储存这些数据。 由于专业的大数据的服务器比较昂贵,Hadoop解决了,在计算机级别服务器上的,大规模数据的存储和分析计算 Hadoop 官网 2、Hadoop 组成结构 HDFS :分布式文件储存系统 Yarn :资源管理和调度系统 MapReduce :分