因子分析法是英国统计学家、心理学家C.E.斯皮尔曼[注]在1904年研究一组学生成绩时所提出的。基本思想是根据相关性的大小把原始变量分组,相关性大的变量分到同一组,不同组之间变量具有较低的相关性,每组变量可被解释为由同一个潜在因子结构所决定。根据因子分析的思想,可把看似错综复杂的一组变量,通过一个简单的因子结构所表示,发现变量背后隐藏的真实结构。探索性分析的基本特征是事先并不确定变量背后的因子结构,而是通过数据分析对隐藏在变量背后的基本结构进行探索发现,属于探索性研究,所以这种因子分析被定义为探索性因素分析。是主成分分析的推广,在教育学、心理学、经济学、气象、地质等领域有着广泛的应用。
探索性因子分析
利用降维的思想,根据原始变量相关矩阵内部的依赖关系,把一些错综复杂关系的变量归结为几个综合因子的多元统计分析方法。
- 英文名称
- exploratory factor analysis
- 所属学科
- 统计学
令表示观测向量,且均值为
,协方差矩阵为
;
表示潜在因子向量,其均值为
,协方差矩阵为单位阵,即向量
的各分量是相互独立的;
与
相互独立,且
,
的协方差矩阵
是对角阵。则模型:
上式为包含个公共因子的因子模型。式中
为特殊因子;
为因子载荷,
的绝对值越大,表明
与
的相依程度越大,或者公因子
对于
的载荷量越大,进行因子分析的目的之一就是要求出各个因子载荷值。
为了更好地理解因子分析,以下说明因子载荷的统计意义以及公共因子与原始变量之间的关系。
①因子载荷的统计意义。由因子模型可知:
即是
与
的协方差。此外,因为
与
的均值都为0,方差都为1,所以
也是
与
的相关系数。
②引入一个概念称为变量的共同度,即,也叫剩余方差,通常记为
。
越大,表明
对公共因子的依赖程度越大,公共因子能解释
方差比例越大,因子结构越有效。
③公共因子的方差贡献,共同考虑的是所有公共因子
与某一个原始变量的关系。与此类似,考虑某一个公共因子
与所有原始变量的关系。记为
,则
表示公共因子
对于每一个变量
所提供的方差的综合,所以被称为公共因子
对原始变量的方差贡献,是衡量公共因子相对重要性的指标。
确定因子载荷是因子分析最为重要的一步。因子载荷的求解方法有很多,如主成分分析法、主轴因子法、最小二乘法、极大似然法、因子提取法等。这些方法因为出发点不同,所得结果也不完全相同。
公共因子可以由观测变量
的线性组合来表示:
该式称为因子得分函数。由于是不可观测因子,只能对它作出估计。估计因子得分的方法有很多,常见方法有:加权最小二乘法、回归法。
①根据研究问题选取原始变量。②对原始变量进行标准化并求其相关矩阵,分析变量之间的相关性。③求解初始公共因子及因子载荷矩阵。④因子旋转。⑤计算因子得分。⑥根据因子得分值进行进一步的统计分析。
扩展阅读
- SPEARMAN C.General Intelligence Objectively Determined and Measured.American Journal of Psychology,1904(5),201 -293.