基于模型的统计推断体系假定有限总体是来自一个无限超总体的样本,总体取值是随机的,目标参数的估计通过建立超总体模型来获得:一个随机模型描述了对总体中所有观测都成立的和
之间的关系。如果总体中的观测真值确实服从这一模型,且入样概率仅通过
依赖于
,则抽样设计对结果一般没有影响。基于模型的推断就是寻找一个生成总体的模型,并估计这个模型的参数。
采用基于模型的推断方法,应检查模型的假设条件是否成立,用模型来拟合数据是否合适,避免建模时进行错误的设定或遗漏自变量。建模中可以分别在使用权数和不使用权数两种情况下拟合模型,如果参数的估计相差较大,则表明建立的模型对部分总体的拟合程度不太好,应该对模型进行重新选择和修正。
基于模型的推断方法对小样本和非概率样本同样适用,参数估计精度一般高于基于设计的推断方法,若模型真实地描述了数据的生成机制,基于模型的推断方法得到的点估计和使用抽样权数计算的点估计相差不大。但由于真实模型未知,难以设定具体的模型,对所有观测值都成立的理论推导模型在调查中通常不存在。
基于设计的推断和基于模型的推断方法各有优劣,实际中可根据以下3点选择推断方法。①根据抽样方案。若没有采用概率抽样,则只能采用基于模型的推断方法。②根据样本量情况。当样本量较大时可采用基于设计的推断方法,当样本量较小时采用基于模型的推断方法。③根据研究的主题的学科理论发展成果。如果学科理论和先前的实证研究支持所构造的模型,建议选择基于模型的推断方法。
基于模型的推断将统计学与其他学科联系起来,提供关于结构关系理论的框架;在复杂抽样中具有重要的实践价值;有利于完善特定背景下的复杂抽样设计,对于调查数据和宏观统计数据的质量评估与控制有重要的应用价值。