OCR_DataSet:收集并整理有关OCR的数据集并统一标注格式刹车实验需要 源码
去做 提供数据集百度云链接 数据集转换为统一格式(检测和识别) icdar2015 MLT2019 COCO-Text_v2 记录 投资回报率 艺术 低速VT 合成器 icdar2017rctw MTWI 2018 百度中文场景文字识别 梅西恩斯 合成中文字符串数据集(360万中文数据集) 英文识别数据大礼包 提供重新编写脚本 下载 下载数据集之后,记得修改标注文件里对应的路径为自己的路径提取码:9s4x 数据集 数据集 主页 适用情况 数据情况 标注形式 说明 ICDAR2015 检测与识别 语言:英文火车:1,000测试:500 x1,y1,x2,y2,x3,y3,x4,y4,转录 坐标:x1,y1,x2,y2,x3,y3,x4,y4转录:框内的文字信息 MLT2019 检测与识别 语言:混合火车:10,000测试:10,000 x1,y1,x2,y2,x3,y3,x4,
文件列表
OCR_DataSet-master.zip
(预估有个33文件)
OCR_DataSet-master
convert
rec
__init__.py
73B
mjsyhtn2txt.py
1023B
baidu2txt.py
1KB
360w2txt.py
1KB
utils.py
4KB
__init__.py
73B
simsun.ttc
17.37MB
暂无评论