设总体分布只包含一个未知参数,且要估计的就是本身(如果总体分布包含若干个未知参数
,而要估计的是
,则基本概念并无不同,方法也基本相同)。设
是从该总体中抽出的样本,所谓的
的区间估计,就是满足条件
的两个统计量
为端点的区间
,一旦有了样本就把
估计在区间
之内。这里有两个要求:①
要以很大的可能性落在区间
内,即概率
要尽可能的大。②估计的精密度要尽可能的高,如要求区间估计的长度尽可能的小,即
尽可能的小;区间估计的平均长度尽可能的小,即
尽可能的小;或某种能体现这个要求的其他准则。这两个要求是相互矛盾的,A.奈曼(A.Neyman)1934年所提出并为现今所广泛接受的原则是:先保证可靠度,在这个前提下尽量使精度提高,即给一个很小的数
(比如
)。如果对参数
的任何值,概率
都等于
,则称区间估计
的置信系数为
。区间估计亦称为置信区间(confidence interval),意思是指对该区间能包含未知参数可置信到何种程度。
如果,则称
是
的置信水平(confidence level)。
如何找到满足条件的随机区间是求置信区间的关键问题,下面介绍求置信区间的枢轴量方法和大样本方法。
对于来自总体的随机样本
,设对固定的
是
的单调(递增或递减)函数,且其分布与
无关,因而事件
等价于
,则称
为
的枢轴量。因此对给定的
,只要确定
,使得:
则就是
的置信度为
的置信区间,注意到这样的
是不依赖于
的。这种求置信区间的方法称为枢轴量法。又如果当
时,
的极限分布与
无关,且:
则就是
的置信度为
的近似置信区间。这种求置信区间的方法称为近似枢轴量法或大样本方法。
例如:为正态分布
,在
未知的条件下来求
的置信区间。由于
。
的分布与任意
和
无关,故
可作为枢轴量,根据枢轴量法,对于给定的正整数
和概率0.95,可得到
满足
因此
。那么区间
以95%的概率包含未知参数
。
在实际问题中,人们只对参数的一端的界限感兴趣,如
是一种物质中某种杂质的百分率(关心上限),或某种材料的强度(关心下限)。若对
的一切可取得值有
,则称
为
的一个置信系数为
的置信上限。若对
的一切可取得值有
,则称
为
的一个置信系数为
的置信下限。