APRIORI算法中使用链表来实现对频繁项集的数据挖掘,在生成k项集时使用FK-1*FK-1的算法,在生成K-项集时直接删除支持度不满足最小阈值的项。
对近年来频繁模式的挖掘进行了总结。首先对有代表性的挖掘算法从算法思想、关键技术、算法的优缺点进行了分析概括,此后列举了一些典型频繁模式及关联规则的领域应用。综述内容的选择主要基于某一个研究后续被关注程
虽然已有的最大频繁项集挖掘算法在结构和技术上已经做了很多改进,但还是存在挖掘速度慢、效率低的缺点,在此提出了图的四叉链表存储结构和基于该存储结构的最大频繁项集挖掘算法,该结构具有一次生成多次使用,不必
分析了Apriori算法关于发现频繁项集的方法及其效率,提出了一种基于上三角项集矩阵的频繁项集挖掘优化算法。本算法只需要扫描数据库一次,不产生候选项目集,也不使用逐层迭代的方法,大大提高了频繁项集的发
大数据环境下高效用项集挖掘算法中过多的候选项集极大地降低了算法的时空效率,为此提出了一种减少候选项集的数据流高效用项集挖掘算法。通过数据流中当前窗口的一次扫描建立一个全局树,并降低全局树中头表入口与节
频繁项集挖掘是数据挖掘应用中的关键问题,而巨大的频繁项集数目成为了现实应用中的阻碍。为了降低频繁项集数量,使其更加利于应用,提出了一种基于格结构的频繁项集精简模型,并证明了该方法产生支持度误差的范围;
在现有的搜索文本中,存在大量的不确定文本结构和内容,使得常规的聚类算法难以实现,并且文本搜索的结果没有进行类聚,造成搜索结果集合数据量非常庞大。提出了基于模糊集的文本搜索的聚类分析的方法,通过模糊技术
为提高频繁项集的挖掘效率, 提出了最大频繁项集树的概念和基于FP2t ree 的最大频繁项集挖掘算法 MAXFP2M iner. 首先建立了FP2t ree, 在此基础上建立最大频繁项集树MAXFP2
一种基于决策树的特征权重优化方法,陈新泉,,应用决策树思想来帮助获取具有混合属性的数据集的“规则聚类区域”,利用“异类数据点子集相离,同类子聚类相紧”的原则来交替��
FP-EMFIA:改进的基于FP-Tree的高效挖掘最大频繁项目集算法