比较算法流数据:评估应用于流数据的九种分类算法的准确性 源码
流数据比较算法 该项目的目标是评估应用于流数据的9种分类算法的准确性。 首先,创建了一个实时数据管道,该管道: 用RandomRBF生成器创建数据源 使用Apache Flink将数据拆分为80%的训练和20%的测试集 附加了Massive Online Analysis(MOA)开源框架,用于逐一应用分类算法, 给出每种应用算法的准确性结果。 之后,获得结果,对9种算法的准确性进行了比较。 对于每种算法,我们采用80K,200K和400K训练集的准确性,并得出结论, OzaBag算法是赢家。 工具-框架 虚拟机:VirtualBox v5.2.26, 硬件设置:2核,6GB RAM,12GB HDD, 作业系统:Ubuntu 18.04(Debian Linux) Oracle Java v1.80, Apache Maven v3.6.0, Apache Flin
文件列表
comparing-algorithms-streaming-data-main.zip
(预估有个6文件)
comparing-algorithms-streaming-data-main
images
pipeline3.png
27KB
RBF_data.png
279KB
running_algor.png
739KB
LICENSE
34KB
.DS_Store
6KB
README.md
3KB
暂无评论