使用步骤 先决条件 Hadoop 2.2或更高版本的群集或沙盒。 Apache Hive。 在15分钟到2天之间生成数据(取决于您选择的比例因子和可用的硬件)。 在您的系统路径中安装了gcc 。 如果您的系统没有,请使用yum或apt-get进行安装。 克隆 git clone https://github.com/kcheeeung/hive-benchmark.git && cd hive-benchmark/ 个别步骤 1.建立基准 建立您要使用的基准(执行所有先决条件) TPC-DS ./tpcds-build.sh TPC-H ./tpch-build.sh 2.生成表 确定所需的数据量。 SCALE大约是#〜GB。 支持的FORMAT包括: orc和parquet 。 TPC-DS nohup sh util_tablegentpcds.sh 10 orc TP