对图像或视频数据中的车辆进行检测是城市交通监控中非常重要并且具有挑战性的任务。该任务的难度在于对复杂场景中相对较小的车辆进行精准地定位和分类。针对这些问题,提出了一个单阶段的深度神经网络(DF-YOLOv3),实现城市交通监控中不同类型车辆的实时检测。DF-YOLOv3对传统的YOLOv3算法进行改进,首先增强深度残差网络提取车辆特征,然后设计6个不同尺度的卷积特征图,并与残差网络中相应尺度的特征图进行融合,形成最终的特征金字塔执行车辆预测任务。在KITTI数据集上的实验表明,提出的DF-YOLOv3方法在精度和速度上均能获得较高的检测性能。具体地,对于512×512分辨率的输入模型,基于英伟达1080TiGPU,DF-YOLOv3获得93.61%的mAP(