textract demo:通过预处理和后期处理增强Amazon Textract 源码

contract_22114 8 0 ZIP 2021-04-20 10:04:25

端到端智能OCR 高级提取功能超越了简单的OCR来从文档中恢复结构的功能:包括表,键值对(如表单上的表单)以及其他棘手的用例(如多列文本)。但是,许多实际应用程序需要将此技术与用例特定的逻辑相结合,例如: 预检查提交的图像是高质量的并且是预期的文档类型将结构化文本的后处理结果放入业务流程级别的字段中(例如,在一个域中,“金额”,“总金额”和“应付金额”可能是同一事物的不同原始注释;而在另一个域中,差异可能很重要! ) 人工审核和再培训流程该解决方案演示了Textract如何与以下产品集成: 图像预处理逻辑-使用创建不需要ML专业知识的高质量自定义计算机视觉结果后处理逻辑-使用自定义逻辑以及NLP 审核和数据注释-使用和 ...在一个简单的示例用例中:从收据图像中提取供应商,日期和总金额。该设计是模块化的,以显示如何可以轻松地针对不同的应用定制此预处理和后处理。解

文件列表

textract-demo-master.zip (预估有个83文件)

textract-demo-master

amplify

.config

project-config.json 448B

team-provider-info.json 3KB

backend

auth

authRolePolicies

authRolePolicies-cloudformation-template.yml 652B

parameters.json 49B

cognito

cognito-cloudformation-template.yml 11KB

parameters.json 2KB

storage

uploadBucket

s3-cloudformation-template.json 12KB

storage-params.json 2B

parameters.json 1KB

hosting

amplifyhosting

amplifyhosting-template.json 863B

backend-config.json 689B

images

architecture-overview.png 227KB

screenshot-success.png 350KB

step-function-screenshot.png 98KB

architecture-overview.drawio 3KB

.github

worflows

frontend_build.yml 890B

amplify.yml 5KB

deployment

a2i-cdklambda-stack.ts 2KB

preproc-cdk-Readme.md 939B

deploy.sh 2KB

.gitignore 476B

Makefile 4KB

README.md 6KB

.editorconfig 135B

source

webui

vue.config.js 128B

package.json 1KB

webui-flow.png 127KB

package-lock.json 831KB

src

App.vue 2KB

assets

logo.png 12KB

main.js 508B

components

SmartOCR.vue 12KB

.gitignore 552B

public

index.html 613B

favicon.ico 4KB

README.md 3KB

babel.config.js 73B

ocr

human-review

images

a2i-render-screenshot.png 280KB

workforce-management-screenshot.png 211KB

fn-human-review-callback

main.py 4KB

requirements.txt 61B

fn-start-human-review

main.py 4KB

requirements.txt 61B

a2i-text-with-checkboxes.liquid.html 5KB

a2i_humanloop.ipynb 27KB

.gitignore 12B

README.md 2KB

postprocessing

fn-postprocess

main.py 7KB

requirements.txt 13B

README.md 2KB

preprocessing

images

rekcl-train-model-split.png 151KB

rekcl-create-dataset-smgt.png 180KB

rekcl-create-dataset-s3.png 192KB

rekcl-model-statuses.png 98KB

preprocessing-flow.png 153KB

preprocessing-flow.drawio 2KB

fn-preprocess

main.py 6KB

requirements.txt 61B

groundtruth-labelling

images

create-labelling-job-screenshot-02.png 282KB

labelling-job-list.png 76KB

smgt-login.png 27KB

workforce-management-screenshot.png 211KB

labelling-bad-image.png 426KB

smgt-task-list.png 38KB

create-labelling-job-screenshot-03.png 322KB

create-labelling-job-screenshot-01.png 219KB

README.md 8KB

README.md 9KB

StateMachine.asl.json 3KB

template.sam.yml 27KB

textract-integration

fn-call-textract

main.py 4KB

requirements.txt 61B

README.md 338B

ui-notifications

fn-notify-progress

main.py 5KB

requirements.txt 13B

images

notifications-overview.drawio 3KB

notifications-overview.png 210KB

fn-setup-iot-auth

main.py 18KB

cfnresponse.py 2KB

requirements.txt 9B

smartocr-post-authentication.py 919B

README.md 6KB

README.md 4KB

用户评论

暂无评论

photoshop照片后期处理动作库

用photoshop轻松处理出漂亮的照片，可以简单处理大批照片

36 2019-05-01
报表统计后期处理与修改

chart报表后期处理代码中有完整的实现flex柱状图饼状曲线等报表精华

25 2019-07-23
基本的人声后期处理步骤

基本的人声后期处理步骤

30 2019-01-08
textract从任何文档中提取文本不要糊涂别大惊小怪源码

textract:从任何文档中提取文本。不要糊涂别大惊小怪

5 2021-02-09
PHP MySQL预处理语句

PHP MySQL 预处理语句预处理语句对于防止 MySQL 注入是非常有用的。预处理语句及绑定参数预处理语句用于执行多个相同的 SQL 语句,并且执行效率更高。预处理语句的工作原理如下: 预

12 2021-01-04
图像预处理相关ppt

简述图像预处理,介绍涉及基本方法。图像增强,边缘检测,平滑等等

9 2020-10-31
数据预处理作业KETTLE

学习数据预处理的群体可以用作参考

12 2021-02-01
函数与预处理.doc

(1)熟悉定义函数的方法、函数实参与形参的对应关系以及“值传递”的方式。 (2)熟悉函数的嵌套调用和递归调用的方法。 (3)熟悉全局变量、局部变量概念和使用方法。 (4)熟悉编译预处理的应用。(5)掌

9 2020-09-17
#pragma预处理指令详解

在所有的预处理指令中,#pragma 指令可能是最复杂的了,它的作用是设定编译器的状态或者是指示编译器完成一些特定的动作。

9 2020-09-20
数据预处理笔记.pdf

此PDF是个人的学习笔记,一共是100多页,内涵源码,涉及到了数据预处理一些常见的处理。由于个人时间、能力有限,所以笔记做的不是特别的好,还望口下留情

19 2020-09-20

textract demo:通过预处理和后期处理增强Amazon Textract 源码

文件列表

用户评论

推荐下载