权数是以某种数量形式,权衡被评价事物总体中诸因素相对重要程度的量值。在抽样调查中用样本数据推断总体参数,权数的作用非常重要。例如对总体总值的推断可以看作是将样本信息放大的过程,其放大系数就可以看作是权数。例如,总值估计量的公式可写成下列形式:
式中为样本单元的集合;
为样本单元
的取值;
为样本单元
的权数。样本通过样本单元权数还原到总体,样本单元权数之和等于总体单元数。
如果采用霍维茨-汤普森估计量,每个样本单元的权数是其入样概率的倒数,即,其中入样概率
为每个总体单元被抽入样本的概率,取值取决于抽样设计。例如在简单随机抽样中,
,其中
是样本量,
是总体规模。当总体单元被抽入样本的概率相同时,每个样本单元的权数也相等,这种样本被称为自加权样本。
样本单元权数的作用主要体现在以下两方面:①在不等概率抽样设计中,样本单元入样概率不同,样本单元对总体的代表性不同,通过样本单元权数构造无偏估计量,实现样本对总体的还原。②由于抽样的随机性,样本结构与总体结构可能产生不一致,可通过样本单元权数调整样本结构。
通常,样本对总体的还原通过计算样本单元设计权数实现;样本结构的调整通过对设计权数进行事后分层调整实现。在概率抽样的条件下可以计算样本单元的入样概率,样本入样概率的倒数即为设计权数。为实现样本单元权数之和等于总体规模,需根据调查中出现的不同问题对设计权数进行调整。调整一般在分类、分层基础上进行。调整内容主要包括特殊因素调整和无回答调整。特殊因素调整主要针对调查实施中与设计不符的情况;无回答调整通过计算无回答调整因子实现。样本结构调整还可利用总体辅助信息进行事后分层实现。