属非参数检验的范畴,主要用于检验样本的最优服从分布。凡是通过构造统计量进行检验的都属于卡方检验。卡方检验是一类检验,我们在描述不同的卡方检验的时候,通常会加上特定名称来加以区分,如皮尔逊卡方检验、配对卡方检验、似然比卡方检验等。平时说的卡方检验,如果没有特殊说明,通常指皮尔逊卡方检验。
卡方检验统计量的计算公式为:
式中表示实际观测频数;
表示期望频数。
由卡方检验统计量的计算公式可知,当观测频数与期望频数完全一致时,值为0;观测频数与期望频数越接近,两者之间的差异越小,
值越小;反之,观测频数与期望频数差别越大,两者之间的差异越大,
值越大。换言之,大的
值表明观测频数远离期望频数,即表明远离假设。小的
值表明观测频数接近期望频数,接近假设。一旦
值超过了一定的临界值,就可以认为观测频数与期望频数的差异超出抽样误差允许的范围,也就可以认定二者是有差异的。因此,卡方检验统计量是观测频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。