已经提出了规模自适应卷积神经网络(SaCNN)用于人群计数,这是机器学习在视频监控中的实际应用。 然而,SaCNN由于其深层结构而导致退化的问题。 因此,本文提出了一种残差多尺度卷积神经网络(RMsCNN)来解决退化问题。 基于SaCNN的骨干,RMsCNN采用残差学习并将图像映射到其人群密度图以进行人群计数。 可以通过集成估计的密度图来实现人群计数。 实验在Shanghaitech和UCF CC 50数据集上进行。 实验结果表明,与最新模型相比,RMsCNN具有更好的性能。