繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于I-ladoop云计算平台
在VC6.0环境下用MFC做的一个频繁项挖掘、增量式关联规则挖掘程序,内置测试数据,解压后可直接运行
针对Lossy Counting算法,即一个基于计数的确定性方案,提出一种新的基于权重的流数据频繁项挖掘算法(Lossy Weight),扩展了流数据频繁项的作用域。Lossy Weight算法不仅可
在现有的搜索文本中,存在大量的不确定文本结构和内容,使得常规的聚类算法难以实现,并且文本搜索的结果没有进行类聚,造成搜索结果集合数据量非常庞大。提出了基于模糊集的文本搜索的聚类分析的方法,通过模糊技术
基于Iceberg概念格叠置半集成的全局闭频繁项集挖掘算法
java频繁项集代码 Apriori算法的核心步骤是: L(K-1)通过自连接求出项数为K的候选项集合C(K) 通过对C(K)进行一系列处理(剪枝 + 支持度判断) 得到L(K)集合
一种快速的约束最大频繁项目集挖掘算法研究,杨君锐,徐龙,发现约束最大频繁项目集是多种数据挖掘应用中的关键问题,目前已有许多算法可用于发现约束频繁项目集,而对约束最大频繁项目集的
近似频繁模式衍生于频繁模式,综合了频繁项集与频繁子图的特点。针对该模式的研究集中在无标签图上,其应用场景主要为社交网络、语义网络、智能电网等。近似频繁模式挖掘过程同时涉及频繁项集挖掘和频繁子图挖掘,因
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频
分析了数据流频繁项挖掘算法EC的不足之处,如不能准确地挖掘最近一段时间内数据流的频繁项。提出了一种频繁项样本特征复合四元组的数据结构来保存样本集合,在此基础上,提出了一种基于滑动窗口的数据流频繁项挖掘