样本方差作为描述性统计量,是对样本数据的分散程度进行描述的度量。对样本量为的随机样本
,样本均值为
,则样本方差为
。它是刻画样本数据分散性的一种指标。样本方差作为一个统计量“差不多”等于该随机变量与样本均值差的平方的平均数(其中“差不多”是指这里平均用
而不是用
作分母),用
作为分母是为总体方差提供一个无偏估计量。样本方差可以近似认为是中心化样本随机变量的二阶样本矩。
首页
[{"ID":42422,"Name":"理学"},{"ID":59818,"Name":"统计学"},{"ID":59827,"Name":"数理统计"},{"ID":59831,"Name":"Data Imputation"}]
. 理学 . 统计学 . 数理统计 . Data Imputation样本方差
/sample variance/
最后更新 2024-12-04
浏览 339次
观测样本与其算术平均数的离差平方的平均数。
- 英文名称
- sample variance
- 所属学科
- 统计学
直接算法。由样本方差的定义直接计算,有:
递推算法。令,
,则有递推公式:
式中,
分别为
的样本均值和样本方差,显然:
两轮算法(减常数法)。设为一常数,可取为
或
,则有:
以上三种算法,直接算法计算量少,计算公式简单;递推算法计算量虽比直接算法大,但它可以给出一系列中间结果,
,且避免了计算
过程中
可能发生的溢出现象,提高了计算结果的精度;两轮算法若取
,计算结果的精度最高,但其计算量比其余两种方法大些。
置信区间:样本均值是数据位置的度量,也就是说,如果将数据画在X轴上,均值大致描述了观测中心在哪里;然而,在数据的分析中,还需要测量观测值的散布情况,而样本方差就是这样的度量。方差的平方根,即标准差提供了一种与X具有相同单位的度量。当总体为正态分布,平均数为,标准差
时,大约95%的观测值可能介于
和
之间。故在处理样本时,用
和
来对样本总体进行估计。
样本方差分布:当总体为正态分布时,样本方差满足:
总体不是正态分布,但样本独立同分布时,虽然无法求出其具体分布,但可得出期望及方差如下:
式中为样本4阶中心矩。
设获得了如下三个样本。样本A:3,4,5,6,7。样本B:1,3,5,7,9。样本C:1,5,9。通过简单的计算可知,三个样本的均值都是5,即。样本容量分别为5,5,3。从而三个样本的样本方差分别为:
由上述计算知,虽然均值相同,但数据的分散程度越来越大。
扩展阅读
- 茆诗松,周纪芗.概率论与数理统计.北京:中国统计出版社,2000.
- KOTZ S.Encyclopedia of Statistical Sciences.2nd ed.New York:John Wiley and Sons,2005.