论文研究基于Charm 运行时环境的异构计算应用容错研究.pdf

chenzijing 17 0 PDF 2020-07-26 17:07:01

容错问题是大规模并行程序长时间运行中不可回避的问题，超级计算机中异构计算部件的加入使得该问题更加复杂。考察由CPU和GPU组成的异构并行系统中应用程序的容错，利用Charm 并行编程模型和CUDA的并行计算架构，对大规模计算宇宙学软件WIGEON进行重构。针对异构并行系统中存在的fail-stop硬件故障，设计并实现了内存检查点的应用容错机制。支持计算恢复后对产生变化的CPU/GPU资源配置进行自适应负载调整。通过在高性能计算机Mole8.5上的实验和分析，验证了异构容错方案的高效性和可行性，故障恢复时间仅需1~4 s。此外，使用分布式冗余数据改进了Charm 现有内存检查点存储模式，对比

用户评论

暂无评论

基于GPU大规模并行计算的异构计算体系介绍

学位论文，讲的比较详细！希望对大家有帮助！

24 2019-05-14
react env React应用程序的运行时环境变量源码

React Env-运行时环境配置从填充您的环境.env文件在运行时,而不是构建时。同构-服务器和浏览器兼容。支持静态网站生成。支持多个.env文件。自述文件例子使用示例(请参阅READ

8 2021-04-18
论文研究基于WebServices的异构组件互操作.pdf

分析了当前主流的分布式组件技术，指出了在Internet环境下这些异构分布式组件技术在互操作性方面的不足。在分析组件互操作的相关技术之后，提出了对组件接口的扩展和基于XML的组件标准化描述，最后提出一

31 2019-09-15
论文研究基于WebServices的异构空间信息共享.pdf

异构集成技术正日益成为信息资源管理的一个热点技术。以地理信息共享的应用为背景，提出了基于WebServices的异构空间信息共享体系结构。通过引入WebServices技术架构，设计了一个异构空间信息

27 2019-09-15
论文研究基于异构网络的楼宇监控系统.pdf

基于异构网络的楼宇监控系统，许英越，李怀瑜，本系统针对高效率楼宇环境参数监控以及如何将检测信号实时、低成本地传输到监测点的问题，研究了采用应用Zigbee的无线传感器网络为

19 2020-07-20
论文研究制造网格环境下异构数据共享技术研究.pdf

回顾了从开放网格服务体系结构(OGSA)到Web服务资源框架(WSRF)的面向服务网格体系的发展历程，分析了网格和P2P两种计算模型的共性和个性特点，在此基础上提出了GlobusToolkit和JXT

33 2019-09-03
论文研究异构环境下MapReduce动态任务调度技术研究.pdf

针对MapReduce在异构环境下各节点性能不均衡，导致整体计算效率低下的问题进行了研究，从节点与任务两方面入手，提出了一种将节点性能量化并排序与将任务按相似度划分相结合的算法。该方法根据历史日志以及

62 2019-09-09
论文研究观察维护需求运行时间指标和总体使用质量的框架

从最初的设计概念到最终的产品支持,发布后的维护通常是软件产品生命周期中最昂贵的阶段。为了减少与发布后维护相关的成本,我们提出了一个运行时框架,以ISO / IEC 25000软件质量和使用中的软件质

7 2020-09-15
Xilinx Alveo加速卡Vitis开发环境异构计算DEMO

给予Xilinx FPGA软件开发环境.使用xilinx官方vitis example创建的向量加法demo包括Host Kernel Link三部分的工程.适合Alveo加速卡的初学者和小白学习项目

7 2023-01-30
论文研究一种基于Ganglia的分布式服务运行时监测方法的设计与实现.pdf

一种基于Ganglia的分布式服务运行时监测方法的设计与实现，甘林，，为了监测分布式服务运行时的性能情况，提出一种基于ganglia进行扩展的监测方法。该监测方法需要将监测逻辑代码和业务逻辑代码运行�

10 2020-05-14

论文研究 基于Charm 运行时环境的异构计算应用容错研究.pdf

用户评论

推荐下载

论文研究基于Charm 运行时环境的异构计算应用容错研究.pdf