Spark:比Hadoop更强大的分布式数据计算项目

qq26927 11 0 PDF 2021-02-23 19:02:52

Spark是一个由加州大学伯克利分校(UC BerkeleyAMP)开发的一个分布式数据快速分析项目。它的核心技术是弹性分布式数据集(Resilient distributeddatasets),提供了比Hadoop更加丰富的MapReduce模型,可以快速在内存中对数据集进行多次迭代,来支持复杂的数据挖掘算法和图计算算法。Spark使用Scala开发,使用Mesos作为底层的调度框架,可以和hadoop和Ec2紧密集成,直接读取hdfs或S3的文件进行计算并把结果写回hdfs或

用户评论

暂无评论

分布式计算云计算与大数据

对一般用户而言:云计算是指通过网络以按需、易扩展的方式获得所需的服务。即随时随地只要能上网就能使用各种各样的服务,如同钱庄、银行、发电厂等。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服

124 2021-02-01
开源分布式数据库Hadoop PPT

开源分布式数据库HadoopPPT，Hadoop使用了POSIX的设计来实现对文件系统文件流的读取。HDFS（HadoopFileSystem）原来是ApacheNutch搜索引擎（从Lucene发展

34 2019-09-27
大数据教程Hadoop伪分布式安装.pdf

大数据教程-Hadoop伪分布式安装，安装、部署详细细节步骤

42 2019-07-28
分布式数据库项目

HBase分析报告博文链接：https://qianxiangdong.iteye.com/blog/407033

12 2020-05-15
Python分布式计算

Python分布式计算

14 2021-01-03
分布式计算实验

分布式计算实验课程的任务是实践分布式计算课程的理论、技术和方法。课程的教学目标是使学生将分布式计算技术和方法运用于实践,尝试分布式软件设计与实现,尝试分布式系统构建。

20 2020-09-19
分布式计算PPT

是学习分布式计算的好资料，详细的讲解，让你了解分布式计算

21 2020-05-24
云计算分布式

本文介绍了云计算分布式的参考知识

45 2020-03-23
分布式计算课件

分布式计算课件3 云计算的基础课程，很重要的技术，课件其他部分都会上传的

32 2019-01-16
分布式计算框架

分布式计算框架

68 2019-01-21

Spark:比Hadoop更强大的分布式数据计算项目

用户评论

推荐下载