“关联分析”平台概述
“关联分析”平台标识独立事件或事务中各组项之间的关系。在关联分析中,是基本的相关对象。例如,项可以是产品、网页或服务。项集是一个或多个项的列表。
两个项集之间的关系由关联规则来定义。关联规则由条件项集和结果项集构成。前项是条件项集中的单个项。关联分析标识关联规则,这些规则预测在条件项集已经包含在某事务中的前提下,结果项集将包含在该事务中。某些关联规则作用较强,因而比其他规则更有用。以下三个性能测度描述关联规则的强度:
支持是其中出现项集的事务的比例。较高的支持值指示该项集经常出现。
置信是在事务包含条件项集的前提下,包含结果项集的事务的比例。置信测量关联规则的隐含强度或预测能力。
提升是关联规则的置信度与其期望置信度的比率,假设前提是:条件项集与结果项集均出现在事务中,且彼此无关联。提升测量结果项集在多大程度上依赖于条件项集的存在。提升的最小值为 0。