适用于Udacity数据工程师Nanodegree的Amazon Redshift项目进行数据仓库 项目概况 这是Udacity数据工程师Nanodegree的数据仓库项目。 在这个项目中,我创建了一个ETL管道,该管道使用Amazon Redshift作为登台机制从Amazon S3提取数据并将其加载到数据库架构中。 该JSON文件表示由虚构的初创公司Sparkify的音乐流应用收集的用户活动日志。 结果数据库将用于分析目的。 Python脚本 create_tables.py :删除先前的架构并创建空表 sql_queries.py :定义ETL管道中使用的所有查询 etl.py :将数据从JSON文件加载到表中 数据库架构 事实表: songplays:日志文件中的歌曲播放记录 尺寸表: 歌手:音乐数据库中的歌手 歌曲:音乐数据库中的歌曲 用户:应用程序的用户 时间:记录的时间戳