基于Apriori算法的Weka数据挖掘应用.pdf
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。算法的名字基于这样的事实: 算法使用频繁项 集性质的先验知识。Apriori使用一种称作逐层搜索的选代方法,k- 项集用于探索(k+1)- 项集。首先,找出频繁1- 项集的集合,该集合记作L1。L1用于找频繁2-项集的集合L2,而L2 用于找L3,如此下去,直到不能找到频繁k- 项集。找每个Lk需要一次数据库扫描。为提高频繁项集逐层产生的效率,一种称作Apriori 性质的重要性质用于压缩搜索空间。Apriori性质: 频繁项集的所有非空子集都必须也是频繁的。
暂无评论