20世纪二三十年代,美国统计学家J.奈曼和英国统计学家R.A.费希尔通过农业实验概念化了随机化作为实现识别的工具,这奠定了实验研究的基础。20世纪70年代,美国统计学家D.B.鲁宾[注]提出的反事实框架(counterfactual framework),即鲁宾因果模型(Rubin Causal Model),为实验研究和非实验研究下进行因果推断构建了一个更一般的框架,成为最常用的因果推断模型,这是随机实验方法进行因果推断的基本框架。2007年,法裔美国经济学家E.迪弗洛[注]等系统介绍了如何将随机化引入研究设计,为研究人员进行随机评估以及如何利用这些评估回答有关经济行为的问题提供了一份实用指南。
发展经济学中实验研究的兴起来自于在面临复杂的和多种途径的因果关系时,对项目效应的可靠识别的担忧。因果推断的本质是在回答反事实(counterfactual)的问题:参与了项目的人在假如没有参与项目时将如何表现、没有接受项目的人在参与项目下将如何表现。研究者往往寻找与处理组(接受干预)相对应的控制组(没有接受干预),通过它们之间的比较来得到项目(政策干预)的平均效应。但在选择比较组时会面临着选择性偏误(selection bias):组间的任何差异都可归因于项目的影响或者事先存在的差异的影响。若没有估计选择偏误的可靠方法,将无法得到准确的估计结果。而随机实验方法的核心思想在于:把参与者随机地分配到控制组和处理组,从而能够得到统计意义上相等的比较组,进而消除选择性偏误,因此通过比较不同组别的平均结果就能准确地(无偏)得到我们所关心的某一干预、政策或项目的处理效应。
在实践中如何进行随机实验,并保证随机实验方法有效进行则需要考虑以下4个方面的内容:
第一,如何在田野研究中引入随机化方法。发展经济学家尝试利用许多不同的方式把随机元素引入到项目(政策),这使得随机化能以最小破坏(minimal disruption)的方式被引入现有项目,目前主要有4种将随机化引入到新的或现有项目的方法:超额认购(oversubscription)、分阶段实施(phase in)、组内随机化(with-in randomization)和激励设计(encouragement design)。
第二,随机化评估面临的各种设计和实施问题。①随机化水平的选择问题。随机化分配应该在个人还是在一个较大的群体(如家庭、村庄等)进行。这需要综合考虑成本、实验设计的功效、溢出效应等问题。②交叉设计。在交叉设计中,通过随机化来确保不同的实验与其他的实验设计相互独立,从而使不同实验被同时检验。政策制定者往往使用包含不同的多个内容的政策来改变感兴趣的结果,而交叉设计能够对政策中的具体内容的效果进行分解,从而弄清楚对穷人具体起作用的部分。③数据收集。这主要集中在3个方面:选择收集什么类型的数据,基线调查以及行政数据。
第三,外部性问题。实验干预会产生溢出效应,使得非处理个体受到处理组影响。如果溢出效应很重要,那么可以专门设计实验来估计其程度和大小。
第四,随机化是否平衡了不同处理组间的各种特征。这往往需要比较处理之前的结果或者在组间比较不受处理过程影响但是影响被试者的变量(例如,年龄、性别、种族等个体特质),即平衡性检验(balance test)。此外,损耗率(attrition rate)也是需要注意的问题。损耗是指不能够获得原始样本中一些个体的结果数据,过大的损耗率会导致参与者不是随机分布的。评估分析中必须首先报告处理组和对照组的损耗水平。
经过多年的发展,随机实验方法已经成为发展研究中一个强大的研究工具,并被广泛运用于发展经济学中诸多领域的研究,包括农业、教育、金融、健康、劳动力市场、腐败治理、政治参与等诸多议题。当然,包含随机化的研究在发展经济学研究中仍只占一小部分,随着实验方法的完善以及发展研究的深入,随机实验方法将有广阔的应用前景。