从大规模数据集中寻找物品间的隐含关系被称作关联分析或关联规则学习。过程分为两步:1.提取频繁项集。频繁项集是指经常出现在一块的物品的集合。反过来,如果一个项集是非频繁项集,那么它的所有超集也是非频繁的。Apriori算法是发现频繁项集的方法。然后对剩下来的集合进行组合以生成包含两个元素的项集。接下来重新扫描交易记录,去掉不满足最小支持度的项集,该过程重复进行直到所有项集都被去掉。从频繁项集中挖掘关联规则当可信度大于最小可信度时,可以认为是含有关联规则的。可以观察到,如果某条规则不满足最小可信度要求,那么该规则的所有子集也不会满足最小可信度要求。
暂无评论