tika-app-1.8.jar,tika可用于解析Office97/2003/2007格式、PDF格式、HTML等格式的文件