文字识别是图像处理中一个普遍的挑战。针对自然场景图像,需先定位文字位置,然后进行识别。一般而言,自然场景图像文字识别包括两步骤:文字侦测解决文字位置与范围,文字识别则转化文字区域为字符信息。CTPN,一种基于CNN与LSTM深度网络的文字侦测算法,能有效检测复杂场景的文字分布,是目前较佳选择。端到端OCR技术有两大主流方法:CRNN OCR与attention OCR,主要区别在输出层转化学习序列特征为识别结果的方式。CRNN采用CTC算法,而attention OCR采用attention机制。本部分重点介绍应用广泛的CRNN算法。