RCNN、Fast RCNN、Faster RCNN 都是基于深度神经网络的图像目标检测模型。虽然这一系列模型在训练和检测上针对精 度与效率都在不断地优化,但是仍旧没有实现训练测试的端到端,而 且当前的检测速度也还无法针对视频进行目标检测。因此,Girshick 团队又提出了针 对视频进行目标检测的模型 YOLO(You Only Look Once),该模型的训练和测试上 都是端到端的操作。