1.HIVE结构 Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数 据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的 机制。Hive定义了简单的类SQL查询语言,称为QL,它允许熟悉SQL的用户查询数据。 同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理 内建的mapper和reducer无法完成的复杂的分析工作。 1.1HIVE架构 Hive的结构可以分为以下几部分: 用户接口:包括CLI,Cl