ocR R绑定到Tesseract。 Tesseract可能是最准确的开源OCR引擎。结合Leptonica图像处理库,它可以读取多种图像格式并将其转换为60多种语言的文本。它是1995年UNLV精度测试中排名前三的发动机之一。从1995年到2006年,它几乎没有做任何工作,但从那时起,谷歌对其进行了广泛的改进。它是在Apache License 2.0下发布的。介绍ocR是一个与OCR Tesseract引擎交互的开源包。安装ocR直接从Github安装需要一些帮助包。设置ocR的最简单方法是获取以下« »脚本,然后使用packagesGithub函数安装并运行该包。此外,它还利用了« »包中的一些功能。该软件包不在CRAN上,必须直接从Bioconductor安装。运行以下代码行安装并加