PdfDocumentParser PdfDocumentParser是一种解析引擎,旨在从符合可预测的图形布局(例如报​​告,账单,表格,票证等)的PDF文档中查找和提取文本/图像。 它的解析方法基于在页面中查找某些文本或图像片段,然后提取相对于那些片段定位的文本/图像。 PdfDocumentParser完成了构建解析模板,搜索,识别和提取的所有棘手工作,因此,只剩下编写自定义逻辑的代码。 PdfDocumentParser是一个.NET DLL。 有关使用PdfDocumentParser或框架的示例,请参考存储库中的SampleParser项目。 已知的问题 因为它是WinFo