PDF主要 最新发布的 PDF-Major是对PDFMiner.six的完整重写。 这意味着它是一种重量更轻的实现,它对数据的假设更少。 该项目的最终目标是提供一个更简单,更快速,更实用的库,临时和低级开发人员都可以在此基础上进行开发。 文献资料 请查看。 基本范例 from pdfmajor . interpreter import PDFInterpreter for page in PDFInterpreter ( "/path/to/pdf.pdf" ): print ( "page start" , page . page_num ) for item in pag