社区版本的Hadoop具备很多的优点,例如:完全的开源免费,活跃的社区,文档资料齐全。但由于Hadoop的生态圈过于复杂,包括Hive、Habase、Sqoop、Flume、Spark、Hue、Oozie等,需要考虑版本和组件的兼容性;同时集群部署、安装、配置较为复杂,需要手工调整配置文件后,对每台服务器的分发配置分发操作,较为容易出错;同时缺少配套的运行监控和运维工具,需要结合ganglia、nagois等实现运行监控,运维成本较高。而Cloudera的CDH版本为目前最成型的发行版本,拥有最多的部署案例。通过CDH提供更为稳定商用的Hadoop版本;提供强大的部1/23署、管理和监控工具,通过统一的可视