一、背景 得到一张数据表如下,现在想把图片中的数字提取出来,之前一直是用在线转换网站:https://ocr.wdku.net/进行处理,结果今天用太频繁了,不让我免费用,居然想跟我收钱,我怎么可能交这种钱呢,于是就打算自己花点时间试试强大的python。 二、baidu-aip 进行图片识别最常用有2种方式,一种是用tesserocr库,需要先安装tesseract,在之前已经玩过,具体可看之前的文章《python 爬取自如网租房信息(解决照片价格问题)》;第二种方式使用百度AI。 使用百度AI需要先申请接口 申请地址:http://ai.baidu.com/ 登陆后,选择图像识别–创建