udacity data modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型源码

qqstretch34489 16 0 ZIP 2021-05-09 01:05:29

使用Postgres进行数据建模罗德里戈·科埃略(Rodrigo Coelho) 介绍这是Udacity数据工程纳米学位的项目。在此项目中,为Sparkify创建了一个数据库,该公司的目标是提高其分析能力概括应用所有ETL步骤以为Sparkify提供星型模式模型。选择了启动模式,因为它是最易于分析的模型之一。总而言之,数据是从JSON源提取的,使用Pandas DataFrame进行转换,然后加载到数据库中。 ETL过程中使用了两组数据。歌曲和日志数据。歌曲数据可提供歌曲和艺术家信息,而日志数据则更为广泛。提供翻唱歌曲,歌手和每首歌的一些元数据。日志数据范围更广,可提供艺术家和艺术家元数据。档案文件该项目是使用python语言和SQL来操作Postgres数据库的。它包含以下文件: create_table.py-创建和删除所有表和数据库; sql_quer

文件列表

udacity-data-modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型 (预估有个112文件)

.gitignore 9B

2018-11-21-events.json 237KB

2018-11-30-events.json 173KB

2018-11-09-events.json 132KB

2018-11-26-events.json 121KB

2018-11-27-events.json 138KB

2018-11-14-events.json 212KB

2018-11-28-events.json 198KB

2018-11-08-events.json 100KB

2018-11-15-events.json 237KB

2018-11-05-events.json 185KB

2018-11-19-events.json 147KB

2018-11-20-events.json 171KB

2018-11-24-events.json 166KB

2018-11-16-events.json 171KB

2018-11-29-events.json 165KB

2018-11-23-events.json 135KB

2018-11-13-events.json 182KB

etl.ipynb 39KB

test.ipynb 19KB

用户评论

暂无评论

matlab实现基于项目的算法

matlab实现基于项目的协同过滤算法，可以处理movielens数据集

40 2019-01-10
udacity projects starter kit这个仓库以我的方式包含了udacity项目的启动文件源码

适用于前端项目的Udacity入门套件无论如何,这个入门文件都不是胆大妄为,这是我改善项目体验并通过循序渐进的方式使学生更轻松地学习的唯一途径分三步解决项目选择您需要开始的项目解决代码中的所有

4 2021-03-18
death_row该项目的目的是要了解对德克萨斯州死囚牢房的一般了解源码

德克萨斯州的死囚牢房该项目的目的是要了解对德克萨斯州死囚牢房的一般了解。幸运的是,可以在此处公开获得有关此主题的大量丰富数据: : 该存储库将包含用于抓取和收集用于分析的相关数据以及分析本身的代码

9 2021-02-22
django best education new Django被用作该项目的后端服务源码

django-best-education-new:Django被用作该项目的后端服务

9 2021-03-13
project tracking intro component该项目的灵感来自FrontendMentor的挑战源码

前端导师-项目跟踪简介组件欢迎! :waving_hand: 感谢您检查此前端编码挑战。挑战可帮助您构建现实的项目,从而提高您的编码技能。为了应对这一挑战,您需要对HTML,CSS和JavaSc

19 2021-04-01
我是如何带领团队开发项目的

最近有不少朋友写信问我一些关于团队开发的问题,由于这段时间有些忙,没有回复.今天写一篇这方面的文章向大家介绍一下我是如何带领团队开发工作流项目的关于团队建设,项目管理的文章网上已经有很多了,在这里我就

42 2019-09-20
opc_django Django项目的自觉项目创建者源码

自以为是的Django Project Creator 描述该脚本创建了一个带有大量其他“东西”的Django项目,以使其更容易进行工作并最终进入生产类型环境。这并不是您的最终配置,而是一个一致的

13 2021-05-02
student registration form该项目的源代码Form source code

学生登记表该项目的源代码

10 2021-05-01
updateServerClient计算机网络的组项目该项目的目的是使客户端和服务器进行通信源码

updateServerClient:计算机网络的组项目-该项目的目的是使客户端和服务器进行通信

3 2021-02-23
TextualEntailment SemanticRelatedness该项目的目的是确定文本含义并测量SICK数据集的语义相关性SemEval2014

文本蕴含语义相关性该项目的目的是确定文本含义并测量SICK数据集的语义相关性(SemEval 2014) 文本蕴含与语义相似度 ***** 代码模块评估SICK数据集中的句子对,以确定其文本含义和语

5 2021-05-04

udacity data modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型 源码

文件列表

用户评论

推荐下载

udacity data modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型源码