ocr-dataset 包含Synthetic Chinese String Dataset 和Chinese_dataset