使用原生的ApacheHadoop,有以下痛点需要解决: 1、集群规模很庞大时搭建Hadoop集群复杂度越来越高,工作量很大 2、规模很大的集群下升级Hadoop版本很费时费力 3、需要自己保证版本兼容,比如升级Hadoop版本后需要自己保证与Hive、Hbase等的兼容 4、安全性很低 Apache官方和一些第三方就发布了一些Hadoop发行版本来解决此类问题。一些有名的发行版本列举如下: •ApacheHadoop •Cloudera’sDistributionIncludingApacheHadoop(CDH) •HortonworksDataPlat