频繁模式挖掘 常用的概念 事务数据库 时间ID 项集(item set) 重要算法 Apriori 主要思想就是从大小1开始遍历可能频繁集k当满足V所有集合子集都在之前计算过的频繁集k中且出现次数满足频繁要求则V为k+1频繁集 这样做有如下好处如果一个集合是频繁集那么它的所有子集都是频繁集如果一个集合不是频繁集那么它的所有超集都不会是频繁集 缺点就是要多次扫描事务数据库 FP-growth 可以用