textract demo:通过预处理和后期处理增强Amazon Textract 源码
端到端智能OCR 高级提取功能超越了简单的OCR来从文档中恢复结构的功能:包括表,键值对(如表单上的表单)以及其他棘手的用例(如多列文本)。 但是,许多实际应用程序需要将此技术与用例特定的逻辑相结合,例如: 预检查提交的图像是高质量的并且是预期的文档类型 将结构化文本的后处理结果放入业务流程级别的字段中(例如,在一个域中,“金额”,“总金额”和“应付金额”可能是同一事物的不同原始注释;而在另一个域中,差异可能很重要! ) 人工审核和再培训流程 该解决方案演示了Textract如何与以下产品集成: 图像预处理逻辑-使用创建不需要ML专业知识的高质量自定义计算机视觉 结果后处理逻辑-使用自定义逻辑以及NLP 审核和数据注释-使用和 ...在一个简单的示例用例中:从收据图像中提取供应商,日期和总金额。 该设计是模块化的,以显示如何可以轻松地针对不同的应用定制此预处理和后处理。 解
文件列表
textract-demo-master.zip
(预估有个83文件)
textract-demo-master
amplify
.config
project-config.json
448B
team-provider-info.json
3KB
backend
auth
authRolePolicies
authRolePolicies-cloudformation-template.yml
652B
parameters.json
49B
暂无评论