组合检查点/重启库 该库为在多个计算节点(计算机)上运行的高性能计算(HPC)应用程序提供了稳定,可扩展,快速的Checkpoint / Restart方法。 XOR擦除编码和伙伴冗余在两层中分层组合。 通过将检查点和XOR奇偶校验数据从上层复制到下层的伙伴节点,可以确保容错能力和故障恢复的灵活性。 编译安装 git clone https://github.com/gongotar/partner-xor.git mkdir partner-xor/build && cd partner-xor/build cmake -DCMAKE_INSTALL_PREFIX: < installa