研究因素既可以是实验性研究中的控制因素,也可以是观察性研究中的暴露因素,也可以是已知的混杂因素等。当只有一个研究因素时为单因素一元方差分析,当有两个或两个以上研究因素时为多因素一元方差分析。一元方差分析常简称为方差分析。
一元方差分析的基本原理可用单因素方差分析介绍:
设研究因素有
个水平
,在水平
下的因变量
的取值服从正态分布
(
),样本容量为
,且
间相互独立。则方差分析模型为:
式中为随机误差,
为误差方差。记
,且令
,
,
为总均值常量。假设因素
与随机误差相互独立。
检验因素对因变量
是否有影响,只需检验零假设
是否成立。若零假设
成立,则说明因素
的效应不存在,反之则说明因素
对因变量
有影响。从方差分析模型可知,当
为真时,
的波动仅由随机误差
引起;当
不成立时,
的波动则由研究因素
的效应
和随机误差
共同引起。因此,通过变异分解可以刻画
波动的影响来源,即
,
为
的方差,在
成立条件下
。
对于上述模型下因变量的一组观测样本值,其样本方差为
分子为总离差平方和,反映因变量样本数据的总变异。
可分解为研究因素
所致变异及随机误差所致变异两部分,即
和
自由度也可分解为相应的两部分,即
和
。且有如下关系:
,
。相应地,研究因素
及随机误差的样本方差(方差分析中称均方
)分别为:
,
且,
。
在成立条件下
,统计量
根据统计量可推断研究因素
对因变量
的影响是否具有统计学意义。方差分析过程可整理成方差分析表1。
变异来源 | 平方和 | 自由度 | 均方 | F值 | P值 |
因素A | SSA | r-1 | MSA | MSA/MSe | |
随机误差 | SSe | N-r | MSe | ||
总和 | SST | N-1 |
多因素方差分析与单因素方差分析类似,但总变异的分解更复杂。例如,研究、
两个因素对因变量
影响的方差分析中,
的总变异
在不同的情况下,可考虑分解为
、
、
三个部分,也可考虑再分解出因素
和
的交互项
共四个部分。
一元方差分析是最重要的假设检验方法之一,广泛用于研究分类因素对连续型因变量的影响,尤其在实验研究中,是分析多个控制因素对实验效应影响的重要统计学工具。