颜色分类leetcode用于目标检测和定位的不变超像素特征通过山姆约翰逊介绍DSeg。DSeg是一种新颖的基于超像素的特征,用于语义分割、对象检测和姿势估计/定位任务。DSeg提取正对象和负对象超像素的形状和颜色,并将这些信息编码在一个紧凑的特征向量中。虽然这个项目还处于起步阶段,但DSeg已经在超像素对象检测(超像素A是对象类B的实例的一部分?)方面显示出了可喜的结果。接下来我们将介绍DSeg的实现细节,展示初步的实验结果,并讨论未来的工作和其他改进。

动机

许多在计算机视觉领域工作或涉足的人已经注意到,图像分割与更高级别的任务(例如检测、分类、定位或更一般的全图像理解)之间存在内在的深度耦合。这些关键的计算机视觉任务和分割之间的相互依赖是不可否认的,而且常常令人沮丧。一个先有鸡还是先有蛋的场景很快就出现了:在不知道物体是什么的情况下,如何正确地找到它的轮廓?另一方面,在确定对象的范围之前,您如何开始了解对象的上下文和身份

超像素分割部分缓解此问题的“巧妙技巧”是超像素分割算法。超像素源于对原始图像的巧妙过度分割。一旦运行了超像素算法...