Spark:比Hadoop更强大的分布式数据计算项目
Spark是一个由加州大学伯克利分校(UC BerkeleyAMP)开发的一个分布式数据快速分析项目。它的核心技术是弹性分布式数据集(Resilient distributeddatasets),提供了比Hadoop更加丰富的MapReduce模型,可以快速在内存中对数据集进行多次迭代,来支持复杂的数据挖掘算法和图计算算法。Spark使用Scala开发,使用Mesos作为底层的调度框架,可以和hadoop和Ec2紧密集成,直接读取hdfs或S3的文件进行计算并把结果写回hdfs或
用户评论
推荐下载
-
分布式计算云计算与大数据
对一般用户而言:云计算是指通过网络以按需、易扩展的方式获得所需的服务。即随时随地只要能上网就能使用各种各样的服务,如同钱庄、银行、发电厂等。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服
124 2021-02-01 -
开源分布式数据库Hadoop PPT
开源分布式数据库HadoopPPT,Hadoop使用了POSIX的设计来实现对文件系统文件流的读取。HDFS(HadoopFileSystem)原来是ApacheNutch搜索引擎(从Lucene发展
34 2019-09-27 -
大数据教程Hadoop伪分布式安装.pdf
大数据教程-Hadoop伪分布式安装,安装、部署详细细节步骤
42 2019-07-28 -
分布式数据库项目
HBase分析报告博文链接:https://qianxiangdong.iteye.com/blog/407033
12 2020-05-15 -
Python分布式计算
Python分布式计算
14 2021-01-03 -
分布式计算实验
分布式计算实验课程的任务是实践分布式计算课程的理论、技术和方法。课程的教学目标是使学生将分布式计算技术和方法运用于实践,尝试分布式软件设计与实现,尝试分布式系统构建。
20 2020-09-19 -
分布式计算PPT
是学习分布式计算的好资料,详细的讲解,让你了解分布式计算
21 2020-05-24 -
云计算分布式
本文介绍了云计算分布式的参考知识
45 2020-03-23 -
分布式计算课件
分布式计算课件3 云计算的基础课程,很重要的技术,课件其他部分都会上传的
32 2019-01-16 -
分布式计算框架
分布式计算框架
68 2019-01-21
暂无评论