cloud_datawarehouse_with_redshift:为一家名为Sparkify的虚构公司设计云数据仓库源码

sometime79458 5 0 ZIP 2021-03-24 02:03:03

使用Redshift的云数据仓库该项目的主要任务是为一家名为Sparkify的虚构公司设计一个云数据仓库,该公司是一个像Spotify / Pandora这样的音乐流媒体平台。 Sparkify已在其网站上记录了有关用户行为的数据。有关的日志数据,歌曲数据和JSON元数据。该数据位于Amazon S3存储桶中。任务是设计一个维度数据模型和ETL管道,以使用Amazon Redshift作为数据存储来构建数据仓库,以便分析团队可以方便地处理数据。使用的技术数据集日志数据集该数据集由JSON格式的用户行为日志组成。它根据年份和月份进行分区。以下是数据集中示例json文件的路径示例。 log_data/2018/11/2018-11-12-events.json log_data/2018/11/2018-11-13-events.json 此数据是由此根据下一部分中讨论的Song

文件列表

cloud_datawarehouse_with_redshift-main.zip (预估有个7文件)

cloud_datawarehouse_with_redshift-main

code

delete_cluster.py 867B

create_tables.py 2KB

etl.py 2KB

create_cluster.py 5KB

queries.py 7KB

.gitignore 86B

README.md 2KB

用户评论

暂无评论

WEB数据仓库

WEB数据仓库 kimball 大师的著作经典图书完整版

65 2019-01-16
数据仓库pdf

BI 必读的经典著作之一，可以详细了解数仓的相关的信息

26 2019-01-21
数据仓库.xmind

中央存储库,英文名称为Data Warehouse,可简写为DW或DWH。是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合

12 2020-08-22
构建数据仓库

qcon-summit-2018

19 2020-05-18
数据仓库简介

数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合，它用于支持企业或组织的决策分析处理。

33 2019-02-18
企业数据仓库

本文介绍了数据仓库，并提供了许多关于如何实现其目标的技巧，包括关于数据收集、决策支持系统、联机分析处理和数据仓库等内容。我为每一概念下定义，并介绍了数据仓库的处理机制，还讨论了用于创建和维护数据仓库的

25 2019-02-16
数据仓库课件

数据仓库，挖掘而为全额误区恶趣味

24 2019-02-21
数据仓库宝典

数据仓库宝典 pdf

25 2019-02-11
数据仓库书籍

数据仓库书籍，pDf 格式

38 2019-03-17
数据仓库资料

数据仓库的学习资料啊!!

28 2019-03-08

cloud_datawarehouse_with_redshift:为一家名为Sparkify的虚构公司设计云数据仓库 源码

文件列表

用户评论

推荐下载

cloud_datawarehouse_with_redshift:为一家名为Sparkify的虚构公司设计云数据仓库源码