关联规则/ association rules // association rules /
根据韩家炜等学者的观点,关联规则定义为:假设I = {I1, I2, …, Im}是项的集合。给定一个交易数据库D,其中每个事务(transaction)t是I的非空子集,即,每一个交易都与一个唯一的标识符tid(transaction ID)对应。关联规则在D中的支持度(support)是D中事务同时包含X、Y的百分比,即概率;置信度(confidence)是D中事务已经包含X的情况下,包含Y的百分比,即条件概率。如果满足最小支持度阈值和最小置信度阈值,则认为关联规则是有趣的。这些阈值通常根据挖掘需要人为设定。