利用PDFBOX提取pdf内容,利用POI提取office系列文件的内容,包括2003和2007版式。JAR包需要自己去下载,此处只有程序,需要说明的是POI下载下来的包ooxml-lib目录下的也需要加入到项目中。