抽样框误差包括以下5种类型:①丢失目标总体单元。抽样框没有覆盖全部目标总体单元,因而有些目标总体单元没有机会被选入样本,这些单元称丢失目标总体单元。②包含非目标总体单元。抽样框中包含一些不属于研究对象的非目标总体单元。③丢失目标总体单元和包含非目标总体单元共存。在抽样框中既有丢失目标总体单元,也包含非目标总体单元。④复合联接。抽样框单元与目标总体单元不完全一一对应,而是存在一对多、多对一或是多对多模式的现象。⑤辅助信息不正确。复杂抽样框中的辅助信息可以用于特殊的抽样方式和不同的估计方法。如果辅助信息不完全或不准确,不但不能提高估计效率,还会降低估计准确性,此外,在连续抽样调查中会出现抽样框老化,即随着时间推移,原来的抽样框不符合实际情况。
丢失目标总体单元将导致总体被低估,假定整个目标总体
由抽样框中丢失的
个元素和在抽样框中的
个元素组成,即
。同样目标总体总量
是抽样框丢失目标总体单元总值和包含非目标总体单元总值之和,即:
用丢失目标总体单元的抽样框进行概率抽样,若选择无偏抽样设计,即。估计量
的均方误差
为:
测定丢失目标总体单元的影响主要包括以下3个公式:①净偏差。可以表示为。②相对偏差。可以表示为
。③净偏差平方
与
的比率。可以表示为
。
检查是否产生抽样框误差的方法主要有以下两类:①使用外部数据,包括与外部数据进行比较、流入流出量测定技术、逆记录检查或双记录系统;②采用特殊采集数据方法,包括质量检查手段和数据联接方法。
修正抽样框误差主要有以下3种途径:①将丢失目标总体单元与抽样框单元实行某种形式的联接方式。②利用有关资料对丢失目标总体单元的数据进行推算或采用核查等方式,查清丢失单元的影响程度,再对估计进行调整。③采用辅助抽样框,同原抽样框一起使用。统计学家H.D.哈特利提出的多重抽样框技术是一种常用方法,通过组合多个抽样框来构造多重抽样框。例如,在国家统计局的规模以下工业抽样调查中,使用了名录框与地域框相结合的多重抽样框,其中名录框用于调查有名录的企业,地域框用于调查不在名录框的非目录企业和个体工业单位。多重抽样框对目标总体的覆盖更全面,而且能有效节约成本,尤其适用于对稀有总体进行抽样的情形。
抽样框包含非目标总体单元将导致总体总值被高估,针对其探查的方法主要有以下两类:①若能识别出非目标总体单元,可采用域估计得到目标总体的无偏估计;②若无法识别目标总体单元,可采用外部数据和质量检查方法发现过涵盖问题。针对同时检查丢失目标总体单元和非目标总体单元的情况,可采用紧密群抽样方法。
针对复合联接,有以下两种补救方法:①消除复合联接,包括分类整理使目标总体单元与抽样单元一一对应、确定唯一的联接规则,在多个抽样单元中只有一个进入抽样总体,重新定义目标总体。②对复合联接进行调整,包括复合逆加权、倒数复合估计等。不正确的辅助信息会降低调查估计的精度,主要产生原因是抽样框资料老化,因此要特别注意辅助信息时间范围的有效性,选择最新的资料作为辅助资料,并利用事后的调查结果对辅助信息的准确性进行检查。