全面的泰卢固语OCR系统 Banti框架 该框架依赖于分割算法将文本分解为字形的能力。 因此,它可以扩展到具有良好分离图像的其他脚本,例如马拉雅拉姆语,奥里亚语,泰米尔语,卡纳达语,泰语等。 特征 打开由antanci_segmenter生成的框文件 将它们传递给训练的神经网络 语言的n-gram建模 能够处理损坏的字形(使用语言模型)。 依存关系 Python3 脾气暴躁,鼻涕,鼻子等 枕头 安装说明 使用Docker映像 最简单的方法是从pull预构建的映像并在容器中run 。 您可以使用以下命令执行此操作。 docker pull chprasad/banti_telugu_ocr:20160310 docker run -it chprasad/banti_telugu_ocr:20160310 /bin/bash 如果您的机器上没有Docker,则可以首先使用文档中的限制