1.1tesseract 1.1.1基础知识 主要用来文字图片的识别,验证码的识别等。就是将图像翻译成文字,也就是文字识别,是由googl公司推出的 安装包下载地址 训练数据集下载地址 使用方式 百度搜索:tesseract,下载该软件,安装 设置该软件的环境变量 在含有想要识别的文件中打开cmd,使用命令tesserct 图片名.png 文本文件名 如果想要识别中文数据,我们可以通过更改训练数据的包来更改。首先,在tesseract中找到目录tessdata,将该数据集中的eng.traineddata文件替换成我们从网上下载的训练集,名字要和原来的文件的名字一样。 1.1.2