TensorFlow多GPU训练官方示例,绝壁不是草泥马写个CUDA_VISIBLE_DEVICES就可以解决的事情。整体思路关键是求变量在各个GPU上的梯度平均值,然后用梯度平均值去更新变量。