Association-Based Data Reduction (REDWOOD)寻找森林中的树Redwood是一个Python框架,通过分析媒体集合的文件元数据来识别异常文件。每个被分析的文件都被分配一个分数,表明其相对于系统中其他文件的声誉——声誉分数越低,文件异常的可能性就越大。给定文件的最终声誉分数基于我们称为“过滤器”的模块分配给它的分数的聚合。过滤器是一个插件,其功能仅受开发人员的创造力限制。Redwood可以支持任意数量的过滤器,只要过滤器扩展RedwoodFilter类并生成一个表,为系统中的每个唯一文件分配一个信誉分数。Redwood框架的大部分目的是使向系统添加新过滤器的过程尽可能顺畅。
暂无评论