SLURM是一种开源的、容错的、高度可伸缩的集群管理和作业调度系统,适用于数千个节点的Linux集群。组件包括机器状态、分区管理、作业管理、调度和流复制模块。本文概述了SLURM的体系结构和功能。