整理PDF文件 python脚本,可将PDF文件从源目录复制到目标目录,并将页面提取为PNG图像和全文。 该脚本目前是非常准系统,但是可以使用。 用法 python ./organizepdfs.py ~/source ~/destination 源目录包含您要移动的PDF文件。 目标目录应如下所示: . |-- /images |-- /pdfs |-- /text 原始PDF将被复制到/pdfs目录。 PDF的每一页都将转换为500px宽的小PNG图像,并保存到/images目录,并在文件名后附加页码。 全文也将被提取并另存为.txt文件在/text 。 要求 有几个依赖项,包括: GraphicsMagick: [aptitude | port | brew] install graphicsmagick 速写: [aptitude | port | brew] insta