利用lucene开发中用到的jar包,可以用来解析txt、pdf、html、doc、xls等