对于解析得到的中间格式(json格式),我们根据文本的坐标以及位置等信息进行结构化提取。本项目做的主要是医疗报告单的解析与提取。 我们把每份报告单的内容分为四部分:title,head,body(table),bottom 对于我们通过