Learn_bigdata 源码
Apache Spark Spark是用于大规模数据处理的统一分析引擎。 它提供了Scala,Java,Python和R中的高级API,以及优化的引擎,该引擎支持用于数据分析的通用计算图。 它还支持丰富的高级工具集,包括用于SQL和DataFrames的Spark SQL,用于机器学习的MLlib,用于图形处理的GraphX和用于流处理的结构化流。 在线文件 您可以在找到最新的Spark文档,包括编程指南。 该自述文件仅包含基本的安装说明。 建筑火花 Spark是使用构建的。 要构建Spark及其示例程序,请运行: ./build/mvn -DskipTests clean package
文件列表
learn_bigdata-master.zip
(预估有个9文件)
learn_bigdata-master
hadoop
hdfs_client.py
2KB
spark
vscodewithspark.py
432B
SparkSQL_DataFrames.ipynb
9KB
jupyterwithspark.ipynb
3KB
.gitignore
75B
datas
model.json
208B
暂无评论