[中文]Spark快速数据处理
Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。 Spark快速数据处理系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存R
用户评论
推荐下载
-
雷达数据处理
ERDASLPS与TerraSolid软件相结合
57 2019-02-27 -
Excel数据处理
Excel数据处理与分析实战技巧精粹,有大量的例子以供分析学习使用
19 2019-03-16 -
LGO数据处理
LGO数据处理及坐标转换
38 2019-03-17 -
数据处理技术
数据处理数据技术
34 2019-03-17 -
数据处理包
这个包里面有大量的字符串处理函数,及一些数据的加密解密。
35 2019-03-07 -
数据处理平台
拿来做测试用的。暂时还不能用,等下次上传更完整的。
47 2018-12-22 -
海量数据处理
海量数据处理 1.应尽量避免在where子句中对字段进行null值判断,否则将导致引擎放弃使用索引而进行全表扫描;2.应尽量避免在where子句中使用!=或操作符,否则将引擎放弃使用索引而进行全表扫描
38 2019-04-17 -
matlab数据处理
matlab数据处理,入门基础,希望和大家一起分享
40 2019-04-06 -
python数据处理
python数据处理,系统介绍数据文件的python处理方法,帮助想学习机器学习数据文件处理的同学快速入门!
42 2019-04-02 -
Origin数据处理
origin数据处理,方便大家进行数据的处理,分析,作图
27 2019-05-15
暂无评论