针对目前大数据快速增加的环境下,海量数据的频繁项集挖掘在实际中所面临的增量更新问题,在频繁项超度量树算法(frequent items ultrametric trees,FIUT)的基础上,引入Ma
基于关联规则的数据频繁集挖掘算法效率分析,杨舒琴,徐国爱,随着数据库、数据仓库的发展,人们的生产生活被越来越多的数据所包围,同时也催生了数据挖掘技术的出现与发展,人们可以借此从海
现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战。如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价
一种快速的约束最大频繁项目集挖掘算法研究,杨君锐,徐龙,发现约束最大频繁项目集是多种数据挖掘应用中的关键问题,目前已有许多算法可用于发现约束频繁项目集,而对约束最大频繁项目集的
在VC6.0环境下用MFC做的一个频繁项挖掘、增量式关联规则挖掘程序,内置测试数据,解压后可直接运行
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频
滑动窗口聚集查询在数据流管理系统中应用广泛,数据流到达高峰期,必须考虑滑动窗口聚集查询中出现的降载问题。分析了子集模型的特点和已有降载策略的不足,给出了数据流滑动窗口聚集查询降载问题的约束条件,提出了
频繁项集挖掘是数据挖掘应用中的关键问题,而巨大的频繁项集数目成为了现实应用中的阻碍。为了降低频繁项集数量,使其更加利于应用,提出了一种基于格结构的频繁项集精简模型,并证明了该方法产生支持度误差的范围;
数据挖掘基本算法 ,频繁集挖掘Apriori算法 VC++语言
为提高频繁项集的挖掘效率, 提出了最大频繁项集树的概念和基于FP2t ree 的最大频繁项集挖掘算法 MAXFP2M iner. 首先建立了FP2t ree, 在此基础上建立最大频繁项集树MAXFP2