storm sentiment:基于Storm的舆情分析
舆情实时统计计算服务项目基于Java实现,主要服务于舆情实时数据的统计分析。
项目框架
-
storm-parent:jar和插件依赖工程
-
storm-dao:数据接口层
-
storm-redis:数据缓存层或消息队列层
-
storm-analysis:基于storm的数据分析层
-
storm-web:API接口服务层
-
storm-core:核心业务层
备注:框架持续更新中。API文档统一放在公司的wiki上。
项目架构
-
MySQL:用于存储基本爬虫数据。
-
Redis:用于数据去重,基本思想是存储每条数据的md5(key),根据该值进行数据插入更新判断。
-
Storm:用于提供分布式流式计算服务。
如果您需要了解更多关于Storm分布式实时计算模式的详细信息,可以参考以下资源:
常见约束词
-
Item
-
Value
-
Dao Interface接口层
-
Domain数据
-
Constant常量
-
Util工具