生成常用项集
“关联分析”平台使用 Apriori 算法减少生成常用项集时所用的计算时间。Apriori 算法利用了这样一个事实:某个项集的支持率绝不会大于其各个子集的支持率。该平台通过组合符合最小支持水平的较小项集来生成较大的项集。此外,该平台不会生成超过指定的最大前项数或最大规则大小的项集。在处理大型数据集时这些选项很有用,因为可能的总规则数会随着项数呈指数增长。有关 Apriori 算法的详细信息,请参见 Agrawal and Srikant (1994)。