新闻数据news_data 是一个致力于处理新闻文章和成绩单,以提供可视化和突出趋势的项目。该项目分为两部分:解析和分析文章与成绩单的处理管道。结果存储在MongoDB中。基于Flask的应用程序,运行WebUI和Web服务,提供对存储在MongoDB中的数据的访问。
支持的新闻来源
- CNN成绩单
处理管道
管道解析和分析给定的文章和抄本集合,结果以每日和每月的粒度级别作为指标数据存储在MongoDB中。管道由多个独立运行的Python模块组成,通过RabbitMQ将已完成工作的消息传递给管道中的下一个模块。
先决条件
使用RabbitMQ并更新news_data/settings.cfg
中的配置;使用MongoDB并更新news_data/settings.cfg
中的相关配置。
暂无评论