展开全部 +
首页 . 农学 . 林业 . 森林经理学 . ﹝森林监测与评价﹞ . 抽样调查

分层随机抽样

/stratified random sampling/
条目作者汤孟平

汤孟平

最后更新 2023-01-17
浏览 390
最后更新 2023-01-17
浏览 390
0 意见反馈 条目引用

将总体按一定的原则分成若干个子总体,每个子总体称为层,在每个层内进行抽样,不同层的抽样相互独立且每层的抽样都是简单随机抽样的方法。

英文名称
stratified random sampling
所属学科
林业

在分层随机抽样中,先根据层样本对层的参数进行估计,然后将这些层估计加权平均或取总和作为总体均值或总量的估计。分层抽样特别适用于既要对总体参数进行估计,也要对各子总体(层)参数进行估计的情形。分层抽样的组织实施方便,样本分布比较均匀,精度一般较高。

1899年,在俄国彼得堡召开的第7届国际统计学会会议上,凯尔继续捍卫“代表性调查”的方法,强调该方法不仅适用于社会经济调查,也适用于农业和林业,同时提出了分层的思想和控制调查结论、便于统计分析的主张,呼吁研究和发展这一方法的实际和理论的各个方面。早在1923年,俄国学者A.A.楚波罗(Alexander Alexandrovich Tschuprow,1874~1926)就提出了分层随机抽样的最优分配,但未引起人们的重视。1925年,英国统计学家R.A.费歇尔(Ronald Aylmer Fisher,1890~1962)在英国罗萨姆斯特德试验站的实验设计中,强调随机化、重复和区组三个基本原则。随机化是获得无偏估计的基础,采用重复技术使得方差估计能够在抽样获得的数据基础上得以进行,而划分区组用于抽样即是分层,目的是为了减少抽样误差。1934年,波兰统计学家J.奈曼(Jerzy Neyman,1894~1981)提出了分层随机抽样的最优分配,并给出了结论的证明,从而建立了分层随机抽样的理论体系。

设总体分为层,以表示层编号,;第层的单元数;层权重;第层的总体和样本平均值分别为:是第层的样本量;样本数;第层总量和样本总量分别为:;第层方差和样本方差:;第层抽样比

样本量最优分配为:

这个结果最早是俄国学者波罗于1923年得到的,但很长时期内未被人注意到。直到1934年,奈曼给出了这一结论的证明,因此样本量最优分配常称为奈曼分配。

在调查目标是总体均值时,或是总体均值估计量方差的上限(或是在置信度下的绝对误差限,),则有:


对样本量的奈曼分配,有:



总体平均数估计值:


总体方差和标准差估计:



总体平均数在置信概率下的双侧置信区间为:


相对误差:


估计精度:


分层随机抽样是最常用的抽样方法之一,具有许多其他抽样方法没有的特点:①分层随机抽样是在各层中进行的,除总体参数估计外,还可用于对层的参数进行估计。②分层样本分别抽自各层,与简单随机样本相比,分层样本在总体中的分布一般更均匀,不会发生偏于某一部分的情况。③分层随机抽样一般能较大程度提高调查精度,这是最重要的特点。如果层内差异比较小(属大多数情况),分层随机抽样精度比单纯随机抽样高。应当说明,由于分层抽样是在各层独立进行的,允许不同层根据具体情况采用不同的抽样方法。

  • 冯士雍,倪加勋,邹国华.抽样调查理论与方法.北京:中国统计出版社,2015.
  • 李金昌.应用抽样技术.北京:科学出版社,2015.
  • COCHRAN W G.Sampling techniques . 3rd ed.New York:John Wiley,1977.
  • 段海波.抽样调查的起源.中国统计,2012(8):28-29.
  • NEYMAN J S.On the two different aspects of the representative methods: the method stratified sampling and the method of purposive selection.Journal of the royal statistical society,1934(97):558-606.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!