使用Apache Spark的现代数据仓库 创建了一个数据仓库模型,该模型可以支持不同数据源的数据。 建立了一个维度模型,该模型可以将具有不同形状的数据导入到数据仓库中。 创建了使用Apache Spark转换和加载数据的流程。 目录 资料夹 此文件夹包含一些示例JSON数据,我们将使用它们来说明数据转换和加载过程。 Spark文件夹 此文件夹包含我们用于将JSON数据加载并处理到我们SQL数据仓库中的所有spark脚本 SQL文件夹 此文件夹包含用于构建维度表和事实表的所有SQL脚本。