europarl crawler:检索欧洲议会发布的文件 源码
Europarl履带 该搜寻器搜寻欧盟议会的网站,并将结果存储在Elasticsearch中。它是由Michael Gertz博士教授指导的高级实用软件的一部分。 完整的文档位于 介绍 欧盟会不断发布文件,以记录该联盟的日常业务。这些文件的来源之一是欧洲议会,该文件在发布了所有文件。该网站具有搜索功能,但不会集中发布所有文档以进行下载。 任务 此实用程序的主要任务是: 开发文档数据和元数据模型在Elasticsearch中实施模型实施活动的Crawler或基于RSS feed的数据检索方法这应使用Python和Elasticsearch实施 开发与运营 依存关系 该项目需要运行Postgres和Elasticsearch的安装。如果在settings.ini -file中正确settings.ini了连接,则会在应用程序启动期间自动配置它们。含义表和索引是在启动期间自动创建的。因此,应使用
文件列表
europarl-crawler-main.zip
(预估有个93文件)
europarl-crawler-main
docs
general
images
Steps@2x.png
121KB
Protocol_file_content_over_time.png
149KB
Kibana_Dashboard.png
1.04MB
Word_protocol_file_content_over_time.png
128KB
operations.rst
2KB
development.rst
2KB
暂无评论