udacity data modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型 源码
使用Postgres进行数据建模 罗德里戈·科埃略(Rodrigo Coelho) 介绍 这是Udacity数据工程纳米学位的项目。 在此项目中,为Sparkify创建了一个数据库,该公司的目标是提高其分析能力 概括 应用所有ETL步骤以为Sparkify提供星型模式模型。 选择了启动模式,因为它是最易于分析的模型之一。 总而言之,数据是从JSON源提取的,使用Pandas DataFrame进行转换,然后加载到数据库中。 ETL过程中使用了两组数据。 歌曲和日志数据。 歌曲数据可提供歌曲和艺术家信息,而日志数据则更为广泛。 提供翻唱歌曲,歌手和每首歌的一些元数据。 日志数据范围更广,可提供艺术家和艺术家元数据。 档案文件 该项目是使用python语言和SQL来操作Postgres数据库的。 它包含以下文件: create_table.py-创建和删除所有表和数据库; sql_quer
文件列表
udacity-data-modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型
(预估有个112文件)
.gitignore
9B
2018-11-21-events.json
237KB
2018-11-30-events.json
173KB
2018-11-09-events.json
132KB
2018-11-26-events.json
121KB
2018-11-27-events.json
138KB
2018-11-14-events.json
212KB
2018-11-28-events.json
198KB
2018-11-08-events.json
100KB
2018-11-15-events.json
237KB
暂无评论