传统的文本检测方法大多采用自下而上的流程,它们通常从低级语义字符或笔画检测开始,然后进行非文本组件过滤、文本行构建和文本行验证。复杂场景中文字的造型、尺度、排版以及周围环境的剧烈变化,导致人的视觉系统是在不同的视觉粒度下完成文本检测任务的,而这些自底向上的传统方法的性能很大程度上依赖于低级特征的检测,难以鲁棒地适应不同粒度下的文本特征。近年来,深度学习方法被应用于文本检测中来保留不同分辨率下的文本特征,但已有的方法在对网络中各层特征提取的过程中没有明确重点特征信息,在各层之间的特征映射中会有信息丢失,造成一些非文本目标被误判,使得检测过程不仅耗时,而且会产生大量误检和漏检。为此,提出一种基于注意力机制的复杂场景文本检测方法,该方法的主要贡献是在VGG16中引入了视觉注意层,在细粒度下利用注意力机制增强网络内全局信息中的显著信息。实验表明,在载有GPU的Ubuntu环境下,该方法在复杂场景文本图片的检测中能保证文本区域的完整性,减少检测区域的碎片化,同时能获得高达87%的查全率和89%的查准率。
用户评论
推荐下载
-
Yolov56.1CoordAtt注意力机制解析与应用实战
Yolov5-6.1版本中添加了CoordAtt注意力机制,本文从原理、实现和应用角度进行详细解析和讲解,并结合实战案例展示了CoordAtt的优越性能。在训练、测试、预测命令方面,与官方版本一致。读
7 2023-06-23 -
基于注意力机制的Seq2Seq模型德英机器翻译
本项目实现了基于注意力机制的Seq2Seq模型,并将其应用于德英机器翻译任务。模型参考了论文 Neural machine translation by joinly learning to alig
5 2024-07-01 -
基于通道域注意力机制的人群密度估计算法研究
人群密度估计对于人流监控与人群安全具有重要意义。针对现有算法主要通过不同尺度感受野来学习特征,而无法高效利用多尺度特征的问题,文中设计了一个基于通道域注意力机制的特征融合模块。该模块可以在训练模型时学
10 2021-01-16 -
基于视觉注意力模型的显著性提取
这是关于计算机视觉研究的论文。是关于视觉注意力模型的显著性提取的一篇论文。
42 2019-05-13 -
基于视觉注意力的视频图像卡通化技术
提出了一种新型的视频图像卡通化处理方案。首先根据视觉显著性模型从输入的视频图像中计算出一张视觉注意力函数图,并将视频图像转换到La*b*色彩空间;在视觉注意图的指导下对低对比度区域用迭代的可分离双边滤
10 2020-10-28 -
基于BERT的中文阅读理解多步注意力网络
基于BERT的中文阅读理解多步注意力网络,周志善,闫丹凤,阅读理解是当前自然语言理解中一个重要的任务,它可以很好的衡量一个自然语言处理模型的能力。为了促进阅读理解任务的发展,有很多�
25 2020-03-10 -
颜色分类leetcode gram:基于图的注意力模型
颜色分类leetcode公克GRAM是一种预测框架,可以以有向无环图(DAG)的形式使用领域知识。通过在训练过程中引入成熟的知识,我们可以学习医学概念的高质量表示,从而进行更准确的预测。预测任务可以采
0 2024-10-06 -
基于B S模型的注意力训练系统设计
注意力不集中现象在儿童中比较普遍,目前,国内外存在的注意力训练方法有纸质量表、行为观察、生物反馈、计算机辅助训练等方式。这些方法无法便捷实现大量人群的训练和训练结果的持续有效追踪。而对儿童进行注意力训
11 2021-01-31 -
基于深度森林的脑电注意力识别研究
针对脑电信号的注意力识别精度问题,本文应用深度森林的算法进行仿真研究。首先对原始脑电信号通过小波分析进行预处理去噪,然后采用深度森林的方法进行分类识别。实验分别对6位受试者在注意和非注意两种状态下的脑
10 2021-02-01 -
注意力训练系统软件
儿童注意力训练软件舒尔特方格、瞬间记忆力训练、划消练习
34 2019-05-31
暂无评论