端到端智能OCR 高级提取功能超越了简单的OCR来从文档中恢复结构的功能:包括表,键值对(如表单上的表单)以及其他棘手的用例(如多列文本)。 但是,许多实际应用程序需要将此技术与用例特定的逻辑相结合,例如: 预检查提交的图像是高质量的并且是预期的文档类型 将结构化文本的后处理结果放入业务流程级别的字段中(例如,在一个域中,“金额”,“总金额”和“应付金额”可能是同一事物的不同原始注释;而在另一个域中,差异可能很重要! ) 人工审核和再培训流程 该解决方案演示了Textract如何与以下产品集成: 图像预处理逻辑-使用创建不需要ML专业知识的高质量自定义计算机视觉 结果后处理逻辑-使用自定义逻辑以及NLP 审核和数据注释-使用和 ...在一个简单的示例用例中:从收据图像中提取供应商,日期和总金额。 该设计是模块化的,以显示如何可以轻松地针对不同的应用定制此预处理和后处理。 解