相关关系指现象或概念之间确实存在着联系,但其关联是不严格固定的或数量关系是不完全确定的一种相互依存关系。相关关系与函数关系不同,后者指变量间存在完全确定的一一对应,是一种严格的确定性关系。相关关系广泛存在于自然界和人类社会之中,是事物之间联系的基本类型之一。其分类中最基本的是线性相关,在众多相关分析方法中,也是以分析变量间的线性关系为主(图1)。
通常使用相关系数对变量之间的关系密切程度进行数字测度,其值定义为协方差除以变量的标准差。相关系数的绝对值在0与1之间(图2)。当相关系数等于-1时,存在负向的线性关系;当相关系数等于+1时,存在完全正向的线性关系;当相关系数等于0时,不存在线性关系;相关系数绝对值的大小,可在一定程度上说明现象之间相关关系的紧密程度。常用的相关系数有皮尔逊相关系数、斯皮尔曼和肯德尔秩相关系数以及偏相关系数等。
相关系数测度的相关分析是情报研究相关分析方法的重要组成部分,例如因子分析、聚类分析等。同时,也包括面向内容的扎根理论和内容分析,面向引用关系的引文分析与链接分析,以及面向连接关系的社会网络分析等广义相关分析方法。
相关分析方法用途广泛,预测和评估都需要用到相关分析的概念和方法,预测可以理解为在过去、现在与未来之间进行相关关系的分析;评估则离不开构造出相关的评估因素或依据相关的程度建立评估模型。