用于Wagtail文档搜索的文本提取 该程序包用于替换的Document类,该类允许使用搜索Document文件内容。 Textract可以从文本中提取(中)PDF,Excel和Word文件。 该软件包的灵感来自Wagtail中的。 文档将像以前一样工作,除了Wagtail的管理界面中的“文档搜索”还将在文件内容中找到搜索词。 一些截图说明。 在安装了wagtail_textract全新wagtail_textract网站中,我们上传了一个的包含手写文本。 它在管理界面中的文档下列出: 现在,如果我们在“文档”中搜索“ correct ”一词(手写单词之一),则实时搜索会找到它: