基于分配适应度的Spark渐进填充分区映射算法
分析Spark的作业执行机制,建立了执行效率模型和Shuffle过程模型,给出了分配适应度(AFD,allocation fitness degree)的定义,提出了算法的优化目标。根据模型的相关定义求解,设计了渐进填充分区映射算法(PFPM,progressive filling partitioning and mapping algorithm),通过扩展式分区和渐进填充映射,建立适应Reducer计算能力的数据分配方案,有效缩减Shuffle过程的同步延时,提高集群计算效率。实验表明该算法提高了Shuffle过程数据分配的合理性,优化了并行计算框架Spark的作业执行效率。
用户评论
推荐下载
-
设计一个可变式分区分配的存储管理方案并模拟实现分区的分配和回收过程最佳适应法
操作系统实验三存储器管理中的动态分区算法,以最佳适应法实现。
41 2018-12-08 -
一种基于破碎度概念的遗传算法自适应调节算法
一种基于破碎度概念的遗传算法自适应调节算法,李鹤,,本文主要针对遗传算法中的早熟问题进行了自适应调节研究。本文利用非空可测集合划分的破碎度量来描述各代种群的多样性,利用个体
14 2020-08-08 -
基于Wavelet_leader_省略_映射算法的回转支承自适应特征提取
基于Wavelet_leader_省略_映射算法的回转支承自适应特征提取
12 2020-07-18 -
基于NAND闪存的自适应闪存映射层设计
闪存存储器主要分为NAND和XOR两种类型,其中NAND型是专为数据存储设计。本文的闪存映射方法主要是针对NAND类型的闪存芯片。一个NAND类型的闪存芯片的存储空间是由块(Block)构成,每个块又
16 2020-10-28 -
操作系统课程设计优先数调度算法时间片轮转算法可变分区管理最先适应算法可变分区最优适应算法
内容有优先数调度算法,时间片轮转算法,可变分区管理最先适应算法,可变分区最优适应算法
36 2019-01-20 -
论文研究Spark中动态分区算法的设计与实现.pdf
Spark中动态分区算法的设计与实现,阎逸飞,王智立,Spark是一种被广泛使用的分布式计算框架。在分布式环境中,一个重要且常见的问题是数据倾斜。为解决Sparkshuffle过程中中间数据倾斜导
9 2020-06-16 -
Spark动态资源分配DynamicResourceAllocation
Spark中,所谓资源单位一般指的是executors,和Yarn中的Containers一样,在Spark OnYarn模式下,通常使用–num-executors来指定Application使用的
7 2021-02-09 -
HDR图像色调映射的自适应色彩调节算法
为了克服传统色调映射算法处理高动态图像过程中因忽略彩色分量而导致图像色彩失真的现象,给出一种自适应的色彩调节算法。该方法首先对图像在亮度域采用色调映射压缩处理,然后再转换到色彩域,采用色彩恢复和色彩增
17 2020-10-16 -
基于OPENGL的填充与裁减算法
基于VC与OPENGL的程序,演示了图形学中填充与裁减算法。
16 2019-09-03 -
在可变分区管理方式下采用最先适应算法实现主存分配和实现主存回收
一、设计内容 主存储器空间的分配和回收。 二、设计目的 一个好的计算机系统不仅要有一个足够容量的、存取速度高的、稳定可靠的主存储器,而且要能合理地分配和使用这些存储空间。当用户提出申请存储器空间时,存
53 2018-12-09
暂无评论