podcast project:Udacity的数据工程师Nanodegree的Capstone项目 源码
播客项目 Udacity的数据工程师Nanodegree的Capstone项目 数据工程的顶峰项目 项目总结 iTunes在其平台上列出了播客,此外,您可以对它们的内容进行评分并留下评论。 Google Analytics(分析)团队希望拥有最高的平均收视率和最高类别的播客。 这些评分和评论位于不同的表中,并且评论的内容超过一百万行,因此数据工程团队被要求创建两个表,每个播客和每个类别的平均评分。 该项目遵循以下步骤: 步骤1:确定项目范围并收集数据 范围 我们将使用三个数据集: 1. categories: categorie of each podcast 2. podcast: general data of each podcast (name, url, id, etc.) 3. reviews: all user reviews on podcasts 而主要目标是把从
文件列表
podcast-project-main.zip
(预估有个7文件)
podcast-project-main
architecture
arquitecure.png
137KB
README.md
2KB
extra_questions
questions.md
1KB
ddl
diagram.png
112KB
data_dictonary.md
555B
Airflow
暂无评论