用java实现的从pdf文件中提取txt的工具。使用了Lucene中的xpdf包实现