Tesseract OCR 关于 这个软件包包含一个OCR引擎- libtesseract和一个命令行程序- tesseract 。 Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。 通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。 它还需要文件来支持旧式引擎,例如tessdata存储库中的文件。 首席开发人员是Ray Smith。 维护者是Zdenko Podobny。 有关贡献者的列表,请参见和GitHub的日志。 Tes