我们研发的中文文字自然场景识别系统基于yolo3与crnn技术,实现了高效的文字检测与识别。该系统不仅支持文字方向检测,涵盖0、90、180、270度的文字方向检测,还同时兼容dnn和tensorflow技术。对于训练方式,我们支持darknet、opencv dnn和keras,可以用于不定长OCR训练,覆盖英文和中英文等多种语言。系统强化了crnn和dense ocr的识别与训练功能,并引入了pytorch转keras模型代码,使得模型之间的转换更加灵活。此外,我们新增了对身份证和火车票结构化数据的识别功能,进一步提升了应用的多样性。对语音模型的修正和CNN+ctc模型的引入,使得DNN模块能够更灵活地调用OCR,同时在单行图像平均处理时间方面实现了惊人的0.02秒以下的速度。