关于中文的识别,效果比较好而且开源的应该就是Tesseract-OCR,此为中文识别经过训练的Tesseract的chi_sim.traineddata中文包