在这篇文章中,我们将讨论mask R-CNN背后的一些理论,以及如何在PyTorch中使用预训练的mask R-CNN模型。狗、猫、人、背景等)对图像中的每个像素。要了解更多关于图像分割的信息,请查看我们已经详细解释过的帖子。除了向RPN和分类器提供特征图外,mask R-CNN还使用它来预测边界框内对象的二值掩码。研究 MaskR-CNN的掩码预测部分的一种方法是,它是一个用于语义分割的完全卷积网络。唯一的区别是在mask R-CNN里,FCN被应用于边界框,而且它与RPN和分类器共享卷积层。mask R-CNN模型期望的输入是张量列表,每个张量的类型为,元素在0-1范围内。图像的大小随意。
暂无评论