udacity data engineering nanodegree:Github资源库用于项目上传 源码
数据工程纳米课程 这GitHub的库是为完成所有完成所需要的项目取得Udacitiy课程。 储存库结构 在仓库中,每个目录代表一个项目(项目按提交时间排序)。 每个目录都有其自述文件,因此请随时检查它们 该项目提供了一个很好的示例,说明了如何使用和psycopg2作为数据库适配器在Postgresql中构建,填充和测试关系数据库(DB)。 在这个项目中,我们使用作为项目的数据源从SQL迁移到NoSQL。 它是使用, cassandra作为DB适配器和CQL作为python之外的编程语言开发的。
文件列表
udacity-data-engineering-nanodegree-master.zip
(预估有个58文件)
udacity-data-engineering-nanodegree-master
Data Modeling with Apache Cassandra
Project_1B_ Project_Template.ipynb
23KB
event_datafile_new.csv
834KB
README.md
650B
Data Lake with Spark
data_lake_final_tables.png
77KB
etl.py
7KB
output.txt
3KB
.gitignore
6B
暂无评论