论文研究基于Spark框架的FPGrowth大数据频繁项集挖掘算法.pdf

Xieminsen 18 0 PDF 2019-09-26 12:09:47

针对大数据中的频繁项集挖掘问题，提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先，根据垂直布局思想将数据按照事务标志符垂直排列，以此解决扫描整个数据集的缺陷；然后，通过FP-Growth算法构建频繁模式树，并生成频繁1-项集；接着，通过扫描垂直数据集来计算项集的支持度，从而识别出非频繁项，并将其从数据集中删除以降低数据尺寸；最后，通过迭代过程来生成频繁k-项集。在标准数据集上的实验结果表明，该算法能够有效挖掘出频繁项集，在执行时间方面具有很大的优越性。

用户评论

暂无评论

论文研究基于分割图集的频繁闭图挖掘算法.pdf

为了解决大规模图集挖掘算法PartGraphMining必须重复扫描图集才能得到全部频繁子图的缺点，提出了一种改进的IPMC算法，通过hash表保存同构图的hash地址和支持度，不必重复扫描图集就可快

17 2019-09-07
论文研究基于FSG的最大频繁子图挖掘算法.pdf

图挖掘已成为数据挖掘领域研究的热点，然而挖掘全部频繁子图很困难且得到的频繁子图过多，影响结果的理解和应用。可通过挖掘最大频繁子图来解决挖掘结果数量巨大的问题，最大频繁子图挖掘得到的结果数量很少且不丢失

21 2020-07-16
研究论文基于改进的FPtree最大频繁模式挖掘算法.pdf

针对FP-growth算法时空效率低的问题,提出了改进的FP-tree构造算法。该算法利用动态结点插入技术构造FP-tree,能有效减小模式树的宽度,达到压缩空间的目的;同时,该算法提高了前缀路径的共

45 2019-09-26
DWDM MODEL LAB APRIORI频繁项集挖掘算法源码

DWDM模型实验室APRIORI- 频繁项目集挖掘算法。

12 2021-04-23
论文研究压缩UF tree挖掘不确定数据频繁项.pdf

针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,

20 2020-08-05
基于深度学习的不确定数据频繁项集挖掘系统

传统不确定数据频繁挖掘系统工作过程花费的时间较长,且挖掘结果与真实结果误差较大。为了解决上述问题,基于深度学习研究了一种新的不确定数据频繁挖掘系统,在硬件结构中建立深度学习挖掘模型,通过传感器、隐层、

12 2021-02-01
一种利用差集的加权频繁项集挖掘算法

挖掘加权频繁项集是多种数据挖掘应用中的关键问题,为提高传统加权频繁项集挖掘算法的性能,在研究概念格模型和差集Diffsets理论的基础上,构建一种利用差集的加权频繁项集格结构,该格结构通过差集性质快速

14 2020-08-20
论文研究高激励项集的挖掘研究.pdf

在现有的搜索文本中，存在大量的不确定文本结构和内容，使得常规的聚类算法难以实现，并且文本搜索的结果没有进行类聚，造成搜索结果集合数据量非常庞大。提出了基于模糊集的文本搜索的聚类分析的方法，通过模糊技术

22 2020-07-24
论文研究一种最大频繁项集快速更新算法.pdf

系统地介绍了最大频繁项集的增量式更新问题，提出最大频繁项目集更新算法FUMFS，并举例说明了算法的执行过程。该算法充分利用已建立的BitMatrix和已挖掘的最大频繁项目集，对已挖掘的最大频繁项目集进

21 2019-08-04
论文研究挖掘滑动时间衰减窗口中网络流频繁项集.pdf

网络流数据频繁项集挖掘是网络流量分析的重要基础。提出一种新颖的基于字典顺序前缀树LOP-Tree的频繁项集挖掘算法STFWFI，该算法采用更符合网络流特点的滑动时间衰减窗口模型，有效降低了挖掘频繁项集

24 2020-07-17

论文研究基于Spark框架的FPGrowth大数据频繁项集挖掘算法.pdf

用户评论

推荐下载