20世纪30年代,许多的调查数据都是实地收集的,为了最小化调查成本及控制与关键估计量相关的不确定性,统计学家们开始使用整群抽样方法收集数据。
按照总体中各群规模是否相等,整群抽样可以分为群规模相等的整群抽样和群规模不等的整群抽样。当群规模相等时,一般采用等概率抽样方法抽取群;群规模不等时,多采用不等概率抽样方法抽取群。以群规模相等的等概率整群抽样为例,在总体个群中,各群包含单元数
相等,采取简单随机抽样方法抽取
个群,则对总体均值
的无偏估计
为:
式中为第
群中第
个单元的目标变量
的观测值;
为第
群中目标变量
的样本均值。
的方差
可表示为:
式中为总体群间方差。
的一个无偏估计
可表示为:
式中,为样本群间方差。
整群抽样是对样本群中的所有单元进行调查,因此抽样误差主要受群间方差影响。为了提高估计精度,划分群的原则应当是使群内方差尽可能大而群间方差尽可能小,即使得同一群内各单元的差异尽可能大,不同群之间差异尽可能小,目的是保证每个群对总体都具有足够好的代表性。
整群抽样的优点是简化抽样框的编制、实施调查便利和节省费用;但因为群内各单元同质性通常较高,所以一般情况下整群抽样的抽样误差较大。