弹性:PyTorch弹性训练 源码

pirate30532 11 0 ZIP 2021-02-18 03:02:05

火炬弹力 TorchElastic允许您以容错和弹性方式启动分布式PyTorch作业。 有关最新文档,请访问我们的。 要求 弹力要求 python3(3.8+) 火炬 等 安装 pip install torchelastic 快速开始 4节点上的容错能力,每个节点8教练员,总共4 * 8 = 32教练员。 在所有节点上运行以下命令。 python -m torchelastic.distributed.launch --nnodes=4 --nproc_per_node=8 --rdzv_id=JOB_ID

用户评论
请输入评论内容
评分:
暂无评论