hive是基于Hadoop的一个强大数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供了完整的sql查询功能。hive还可以将sql转换为MapReduce任务进行运行,提高大数据的查询效率。作为建立在Hadoop上的数据仓库基础构架,hive可以进行数据提取转化加载(ETL),用来存储、查询和分析存储在Hadoop中的大规模数据。下载资源包后,可以在linux系统下直接压缩使用安装hive。