docconv:将PDFDOCDOCXXMLHTMLRTF等转换为纯文本 源码
docconv Go包装器库,可将PDF,DOC,DOCX,XML,HTML,RTF,ODT,Pages文档和图像(请参见下面的可选依赖项)转换为纯文本。 对于code.sajari.com/docconv用户的注意事项:该软件包的Go导入路径已移至code.sajari.com/docconv 。 安装 如果您尚未安装Go,则首先需要 。 要获取并构建代码: $ go get code.sajari.com/docconv/... 这还将在$GOPATH/bin构建命令行工具docd 。 确保$GOPATH/bin在PATH环境变量中。 依存关系 整洁,wv,popplerutils
文件列表
docconv-master.zip
(预估有个82文件)
docconv-master
image.go
387B
url.go
635B
client
client.go
3KB
cmd
docconv-client
main.go
774B
.gitignore
24B
go.mod
882B
暂无评论