具有上采样模块的DenseNet用于识别图像中的文本
卷积递归神经网络(CRNN)在OCR的研究中取得了巨大的成功。 但是现有的深度模型通常在池化操作中应用下采样,以通过丢弃一些特征信息来减小特征的大小,这可能会导致丢失占用率较小的相关字符。 而且,循环模块中的所有隐藏层单元都需要在循环层中连接,这可能导致沉重的计算负担。 在本文中,我们尝试使用密集卷积网络(DenseNet)替代CRNN的卷积网络来连接和组合多个功能,从而潜在地改善结果。 另外,我们使用上采样功能构造一个上采样块,以减少池化阶段下采样的负面影响,并在一定程度上恢复丢失的信息。 因此,信息特征也可以用更深层次的结构来提取。 此外,我们还直接使用内部卷积部分的输出来描述每个帧的标签分布,以提高处理效率。 最后,我们提出了一个新的OCR框架,称为DenseNet,带有上采样块联合和连接主义的时间分类,用于中文识别。 中文字符串数据集上的结果表明,与几种流行的深度框架相比,我们的模型提供了增强的性能。
暂无评论