检测并提取来自上千种不同文件类型(如PPT,XLS和PDF)中的元数据和结构化文本。除了用gui进行操作外,还可以在命令行界面中使用java -jar tika-app-1.15.jar --text .doc命令进行文本格式的转换,text为要转变的格式,.doc为你想要转变的文本的物理位置。