若在假设检验问题中的假设可以用一个参数的集合表示,称该假设检验问题为参数检验问题(parametric test problem),否则对总体分布函数的表达形式或随机变量间的独立性等提出假设并检验的问题称为非参数检验问题(non-parametric test problem)。
假设检验
对于单个或多个总体的分布或分布中所含参数的假设称为统计假设(statistical hypothesis),简称假设(hypothesis)。根据样本的信息,在一定可靠程度上对原假设作出判断:是否拒绝原假设。若拒绝了原假设,则选用备择假设。这种统计判决方法称为假设检验。
- 英文名称
- hypothesis testing
- 所属学科
- 数学
一个统计假设检验问题中常涉及两个假设。所要检验的假设称为原假设或零假设,记为,与
不相容的假设称为备择假设(alternative hypothesis)或对立假设,记为
。关于统计结构
的零假设和备择假设可表示为:
式中和
为
的两个互不相交的非空子集。在参数分布族
情形中,原假设和备择假设可分别表示为:
式中和
为参数空间
的两个互不相交的非空子集。给定
和
就等于给定了一个统计假设问题,记为
。通常来说,零假设是要受保护的,是对总体分布或分布参数的简单而正面的描述,零假设和备择假设一般不可互换。
若一个假设只包含一个元素,则称该假设为简单假设。对于参数统计结构,
的统计检验问题:
(式中
)就是一个典型的零假设和备择假设都是简单假设问题。
若一个假设可以拆分成有限个或无限多个简单假设,则称为复合假设。例如,参数统计检验问题:,
就是一个典型的零假设和备择假设都是复合假设问题。
设为定义在
上的可测函数,满足条件
,则称
为检验函数,简称检验(test)。具体说,考虑一般的参数假设检验问题:
则就是一个检验函数,式中
为
的可测子集;
为示性函数。若对任意的
有
, 则称
为假设问题(*)的水平为
的检验。
如果一个检验是拒绝域
的示性函数,仅取0,1两个值,则检验的拒绝域为
,这种检验称为非随机化检验(non-randomized test)。如果
能取
内之值,若抽到样本
,则以
的概率拒绝原假设
,检验就称为随机化检验。
在假设检验问题中,所谓检验就是设法把样本空间划分为互不相交的两个可测集:
且当观测值时,就拒绝零假设
,认为备择假设
成立;当观测值
(即
)时,则不能拒绝原假设
。这里的
称为检验问题的拒绝域或否定域(critical region),
称为接受域(acceptance region)。
在参数的假设检验问题中,称样本观测值落在拒绝域的概率为检验的功效函数或势函数,记为:
指当观测数目无限增加时,能可靠地分辨一个假设及其对立假设的统计检验。
设为取值于样本空间
且分布族为
的独立同分布随机变量,统计检验问题为:
预先给出一个犯第一类错误概率,即显著性水平,并用前
个样本
去构造一个水平为
的统计检验
,以检验上面的检验问题
,并以
为其功效函数。显然应有
对一切
。如果这一列功效函数
有以下性质,
固定的
,有:
则称为检验为检验问题
的一列水平为
的相合检验。统计检验的相合性质可表示为:其相应的功效函数
在
上收敛于恒等于1的函数。