1:什么是hive:由facebook开源的用于解决海量结构化日志的数据统计 2:hive是基于hadoop的数据仓库工具,可以将结构化的数据文件映谢成一张表,并提供类SQL查询功能。 本质:将Hql转化成mpareduce 其基本执行过程: 数据仓库通过sql进行统计分析——–>将SQL语言中常用的操作(select,where,group等)用mapreduce写成很多模板 所有的mapreduce模板封装在hive中—>通过hive框架匹配出相应的mapreduce模板—->运行mapreduece生成相应的分析结果—>result->client—>用户根据业务需求编写相应的