spark training:用于Spark培训的存储库 源码
Spark培训资料库 该存储库包含由dimajix进行的Spark和Hadoop培训的许多不同示例,练习和教程。 您随时可以在GitHub上找到最新版本 https://github.com/dimajix/spark-training 内容 存储库包含不同类型的文档 Spark / Scala的源代码 适用于PySpark的Jupyter笔记本 Zeppelin笔记本用于Spark / Scala Hive SQL脚本 猪脚本 ...以及更多 外部依赖 一些笔记本需要在S3上s3:// dimajix-training / data /上由dimajix提供的一些测试数据。 建筑可执行文件
文件列表
spark-training:用于Spark培训的存储库
(预估有个312文件)
.gitignore
10B
Dockerfile
173B
.gitignore
10B
.gitignore
10B
.gitignore
10B
persons_header.csv
137B
persons_headerless.csv
117B
common.conf
1KB
wordcount.conf
96B
NYC Taxi Trips - Part 4 - Integrate - Full.ipynb
1.16MB
暂无评论