Redshift_Data_Warehouse:这是来自数据工程Udacity课程的项目3 源码

choosy6430 8 0 ZIP 2021-04-18 05:04:23

项目描述音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及其应用程序中的歌曲上具有JSON元数据的目录中。 Sparkify希望数据工程师构建执行以下操作的ETL管道: - Extracts their data from S3 - Stages them in Redshift - Transforms data into a set of dimensional tables - Continue finding insights in what songs their users are listening to. 项目数据集这两个数据集位于S3中。歌曲数据集第一个数据集是“百万歌曲”数据集中的真实数据的子集。每个文件均为JSON格式,并包含有关歌曲

文件列表

Redshift_Data_Warehouse-master.zip (预估有个11文件)

Redshift_Data_Warehouse-master

log-data.png 118KB

Top_5_Popular_Songs.png 17KB

dwh_config_empty.cfg 891B

Top_5_locations.png 15KB

Visualization.ipynb 63KB

Songplays_per_level.png 9KB

etl.py 1KB

README.md 6KB

sql_queries.py 7KB

create_cluster_IaC.py 6KB

create_tables.py 671B

用户评论

暂无评论

CIS Portfolio来自不同CIS课程的项目源码

CIS-Portfolio:来自不同CIS课程的项目

8 2021-02-23
Udacity_Data_wrangling_Project源码

Udacity_Data_wrangling_Project

8 2021-02-22
DEND_Redshift_Data_Warehousing使用SQL和Python在Amazon Redshift中进行数据仓库源码

适用于Udacity数据工程师Nanodegree的Amazon Redshift项目进行数据仓库项目概况这是Udacity数据工程师Nanodegree的数据仓库项目。在这个项目中,我创建了一

15 2021-03-19
udacity_weather_trends Udacity Data Analyst纳米学位的第一个项目源码

udacity_weather_trends Udacity Data Analyst纳米学位的第一个项目

8 2021-03-31
数据仓库设计中文_design of data warehouse

数据仓库设计的经典书籍，是架构师,设计者不可不读的好书。粒度的设计：双重粒度数据分割，数据性能数据模型,元数据有详细标签作标注

32 2019-05-27
数据仓库Data Warehouse入门教程

数据仓库（DataWarehouse）入门教程。

27 2019-09-15
udacity kubernetes项目源码

Udagram Kubernetes项目安装种类(本地Kubernetes) curl -Lo ./kind "https://kind.sigs.k8s.io/dl/v0.8.1/kin

17 2021-03-20
Udacity Self Driving Car Engineer Udacity课程源码

Udacity-Self-Driving-Car-Engineer:Udacity课程

20 2021-04-05
20_udacity_dse Udacity的数据工程纳米学位资料库源码

20_udacity_dse Udacity的数据工程纳米学位资料库

6 2021-03-31
devops capstone这是我针对Udacity Cloud DevOps Nanodegree的Capstone项目源码

Udacity-DevOps-Capstone-滚动部署这是Udacity DevOps Nanodegree的基本项目。在这里,我们将使用滚动部署通过Jenkins在Kubernetes Clu

15 2021-02-19

Redshift_Data_Warehouse:这是来自数据工程Udacity课程的项目3 源码

文件列表

用户评论

推荐下载