自然场景汉字数据集规范汉字.tar.bz2 此数据集为自然场景下的特定场景下的汉字数据集,即,不包含自然场景下的手写体、过度扭曲图、以及艺术体,可以参考道路交通路标上的规范字体,数据集解压后,此数据集包含2602类汉字,32万张汉字图片,里面包括黑体白字以及白体黑字,以适应不同的字体,而非清一色的白体黑字或者黑体白字。
自然场景中文汉字数据集下载.tar.gz 本数据集包括3273类汉字,共47万张汉字图片,解压后,每类汉字归类在一个文件夹下,各图像尺寸不一,包含在自然场景下能见到的各种字体。本人由于需要大量的自然场景中文汉字数据集,因此从各处搜来大量标注的自然场景图片数据集,处理之后得到汉字数据集。使用这些汉字数据集训练后,在我自己的项目数据上也能识别很