如何配置和运行解析器

Required模块:需要安装以下Python模块: RDFLib ( ), PDFMiner ( ),抢( ), PyPDF2 ( )。

Configuration

所有配置设置都应该在config.py文件中,该文件应该通过重命名从config.py.example创建。

Input urls

输入url列表被设置为input_urls变量的Python列表。

DBpedia数据集(包含国家和大学)解析器使用提取国家和大学的名称,以及它们在DBpedia中的URI。共有三个选项:使用原始数据集。默认情况下,什么都不应该配置,要使用,则sparqlstore['dbpedia_url']应更改为http://lod.openlinksw.com/sparql,要使用本地转储,这是