数据工程纳米数据仓库 一家虚构的音乐初创公司Sparkify已扩大了用户群,并希望将其流程转移到云中。 作为他们的新数据工程师,任务是将驻留在Amazon S3上的日志文件中的数据移到Amazon Redshift登台表中。 然后将对数据进行预处理,并将其从登台表移至维模型。 项目目标 该项目的目的是将获得的知识应用于实际项目。 概念包括: 专用于Amazon Redshift的云数据仓库建模 将数据从S3存储桶移至Redshift 使用云技术进行故障排除和调试 项目结构 sql_queries.py 该脚本包含将在Amazon Redshift上执行的所有SQL查询。 查询包括: 创