新闻数据news_data 是一个致力于处理新闻文章和成绩单,以提供可视化和突出趋势的项目。该项目分为两部分:解析和分析文章与成绩单的处理管道。结果存储在MongoDB中。基于Flask的应用程序,运行WebUIWeb服务,提供对存储在MongoDB中的数据的访问。

支持的新闻来源

  • CNN成绩单

处理管道

管道解析和分析给定的文章和抄本集合,结果以每日每月的粒度级别作为指标数据存储在MongoDB中。管道由多个独立运行的Python模块组成,通过RabbitMQ将已完成工作的消息传递给管道中的下一个模块。

先决条件

使用RabbitMQ并更新news_data/settings.cfg中的配置;使用MongoDB并更新news_data/settings.cfg中的相关配置。