Data_warehouse 源码

qqerrand53011 16 0 ZIP 2021-03-16 19:03:17

项目数据仓库项目介绍音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。在此项目中,我们将创建一个ETL管道,该管道将从S3中提取数据,在Redshift中进行分级,并将数据转换为一组维度表,供其分析团队使用,以继续寻找用户正在收听的歌曲的见解。项目数据集歌曲数据集第一个数据集是“集中的真实数据的子。每个文件均为JSON格式,并包含有关歌曲和该歌曲的歌手的元数据。这些文件按每首歌曲的曲目ID的前三个字母进行分区。样本数据: {"num_songs": 1, "artist_id": "ARJIE2Y1187B994AB7", "artist_latitude": null, "artist_lon

文件列表

Data_warehouse-master.zip (预估有个7文件)

Data_warehouse-master

.DS_Store 6KB

etl.py 691B

README.md 3KB

__pycache__

sql_queries.cpython-36.pyc 5KB

dwh.cfg 354B

sql_queries.py 5KB

create_tables.py 671B

用户评论

暂无评论

Wiley.The.Data.Warehouse.Toolkit.3rd.Edition.Jun.2013

Wiley.The.Data.Warehouse.Toolkit.3rd.Edition.Jun.2013

30 2020-01-02
The Microsoft Data Warehouse Toolkit With SQL Server2005and the Microsoft Bus

PDF文件,byJoyMundy(Author),WarrenThornthwaite(Author),RalphKimball(Contributor)

32 2019-06-01
Wiley.Building.the.Data.Warehouse.Sep.2005.eBook_DDU.pdf

Building the data warehouse

24 2019-01-02
PWD Warehouse3源码

PWD-仓库3

9 2021-04-04
warehouse仓库管理系统源码

系统名称仓库管理系统系统概要仓库管理系统总共分为两个大的模块,分别是系统模块和业务模块。其中系统模块和业务模块底下又有其子模块。功能模块一,业务模块 1,客户管理客户清单客户分页和模糊查

15 2021-04-06
Modern Data warehouse使用SQL ServerApache Spark构建现代数据仓库源码

使用Apache Spark的现代数据仓库创建了一个数据仓库模型,该模型可以支持不同数据源的数据。建立了一个维度模型,该模型可以将具有不同形状的数据导入到数据仓库中。创建了使用Apache Sp

2 2021-04-03
Redshift_Data_Warehouse这是来自数据工程Udacity课程的项目3源码

项目描述音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及其应用程序中的歌曲

8 2021-04-18
数据仓库ETL工具箱Data Warehouse ETL Toolkit

数据仓库ETL工具箱DataWarehouseETLToolkit

23 2019-09-21
Ralph Kimball.The Data Warehouse Toolkit..The Complete Guide to Dimensional Mo

RalphKimball.TheDataWarehouseToolkit..TheCompleteGuidetoDimensionalModelling

17 2019-06-03
Warehouse Builder

WarehouseBuilder官方资料哟好好学习

28 2019-05-28

Data_warehouse 源码

文件列表

用户评论

推荐下载