使用lucene进行文档搜索 读取pdf文件内容到字符串