基于图像的表格检测、识别数据集,建立在互联网上Word和Latex文档的新型弱监督基础上,包含417K高质量的标记表