比如一张原图里有五个目标,标签是五张对应于五个类别的.png格式的二值图(每张.png图像内只有一个类别,且目标像素为1,背景像素为0;且每个.png图像以“原图名_类别名_原图名”方式命名,参考下图),那么我们可以用我写的代码直接将数据转换为训练所需的train.record和val.record