使用Amazon Textract进行大规模文档处理 该参考架构显示了如何使用Amazon Textract从文档中提取文本和数据。 以下是参考体系结构的一些关键属性: 将传入文档处理到Amazon S3存储桶。 在Amazon S3存储桶中处理现有文档的大量回填。 无服务器,高可用性和高度可扩展的体系结构。 轻松处理棘手的工作负载。 支持Amazon Textract的Sync和Async API的管道。 在不执行任何复杂的分布式作业管理的情况下,控制处理文档的速度。 此控件对于保护将从Textract提取输出的下游系统非常重要。 利用示例实现,以代码形式定义基础架构并通过Cl