Hive:由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL/SQL转化成MapReduce程序。 1)Hive处理的数据存储在HDFS。 2) Hive分析数据底层的实现是MapReduce。 3) 执行程序运行在Yarn上