空间关联规则由空间对象和表示空间关系的空间谓词来定义,通过设定支持度阈值和可信度阈值,可以从海量地理空间大数据中挖掘空间关联规则。支持度表示该规则在整个数据集中出现的概率,可信度为规则中空间对象同时出现的概率,例如河流与公路相交,则相交处有桥(支持度为7.5%,可信度为100%)这一规则中,河流和公路分别代表两个对象,空间谓词是相交,规则的支持度为7.5%表示,在数据集中7.5%的记录包含河流和公路,可信度用100%表示,在河流和公路相交的情况下,有桥的概率是100%。
空间关联规则挖掘算法是在传统关联规则挖掘算法基础上的改进。其思路是,首先计算空间对象的空间关系,然后采用传统的关联规则两步法产生规则,即先根据最小支持度识别出高频繁项集,后根据最小可信度生成所有的空间关联规则。由于对象间的空间关系存在大量可能性,因此需要预先设定感兴趣的空间谓词。