Ta上传的资源 (0)

pacheTika利用现有的解析类库从不同格式的文档中(例如HTMLPDFDoc侦测和提取出元数据和结构化内容功能包括:侦测文档的类型字符编码语言等其他现有文档的属性