TextExtraction:从各种格式的文件中提取文本 源码

qqapt75312 13 0 ZIP 2021-04-22 17:04:39

文字提取 介绍: 从各种格式的文件中提取文本。 格式: Microsoft Office-Word,Excel和PowerPoint 旧版本(97-03); 新版本; 宏文件。 纯文本文件文本 富文本格式(RTF) 便携式文件格式(PDF) 文件类型; 扫描类型(使用OCR) 类似于Excel的格式CSV和tsv 开放文件格式(ODF) ods; odt; odp 标记语言格式Markdown(md); Yaml(yml); HTML(html,htm); xml; chm; 乳胶(tex) 电子邮件eml; 味精 电子书手机epub; z 压缩格式压缩; rar; 柏油;

用户评论
请输入评论内容
评分:
暂无评论