本文主要介绍了一种新的目标检测方法——YOLO。相较于之前的方法,该方法将目标检测框架看作回归问题,从空间上分割边界框和相关的类别概率,并采用单个神经网络在一次评估中直接从整个图像上预测边界框和类别概率。由于整个检测流程是单一网络,因此可以直接对检测性能进行端到端的优化。我们的统一架构非常快。通过实验得出,我们的基础YOLO模型以45帧/秒的速度实时处理图像。Fast YOLO是YOLO的一个较小版本,每秒能处理惊人的155帧图像,同时实现其他实时检测器两倍的mAP。与最先进的检测系统相比,YOLO虽然存在定位错误,但很少将背景预测成假阳性。最终,我们凭借YOLO的学习能力获得了通用的目标表示,从自然图像到艺术品等其他领域泛化时,它都优于其他检测方法,包括DPM和R-CNN。
暂无评论