udacity data engineering nanodegree sparkify data house:一家虚构的音乐初创公司Sparkify扩大了用户
数据工程纳米数据仓库 一家虚构的音乐初创公司Sparkify已扩大了用户群,并希望将其流程转移到云中。 作为他们的新数据工程师,任务是将驻留在Amazon S3上的日志文件中的数据移到Amazon Redshift登台表中。 然后将对数据进行预处理,并将其从登台表移至维模型。 项目目标 该项目的目的是将获得的知识应用于实际项目。 概念包括: 专用于Amazon Redshift的云数据仓库建模 将数据从S3存储桶移至Redshift 使用云技术进行故障排除和调试 项目结构 sql_queries.py 该脚本包含将在Amazon Redshift上执行的所有SQL查询。 查询包括: 创
文件列表
udacity-data-engineering-nanodegree-sparkify-data-warehouse-master.zip
(预估有个8文件)
udacity-data-engineering-nanodegree-sparkify-data-warehouse-master
.gitignore
2KB
requirements.yml
6KB
sql_queries.py
7KB
spec-file.txt
20KB
README.md
3KB
dwh.cfg
210B
etl.py
2KB
create_tables.py
2KB
暂无评论