首页 . 理学 . 统计学 . 数理统计 . Data Imputation

样本方差

/sample variance/
条目作者胡涛

胡涛

最后更新 2024-12-04
浏览 339
最后更新 2024-12-04
浏览 339
0 意见反馈 条目引用

观测样本与其算术平均数的离差平方的平均数。

英文名称
sample variance
所属学科
统计学

样本方差作为描述性统计量,是对样本数据的分散程度进行描述的度量。对样本量为的随机样本,样本均值为,则样本方差为。它是刻画样本数据分散性的一种指标。样本方差作为一个统计量“差不多”等于该随机变量与样本均值差的平方的平均数(其中“差不多”是指这里平均用而不是用作分母),用作为分母是为总体方差提供一个无偏估计量。样本方差可以近似认为是中心化样本随机变量的二阶样本矩。

直接算法。由样本方差的定义直接计算,有:


递推算法。令,则有递推公式:



式中分别为的样本均值和样本方差,显然:


两轮算法(减常数法)。设为一常数,可取为,则有:



以上三种算法,直接算法计算量少,计算公式简单;递推算法计算量虽比直接算法大,但它可以给出一系列中间结果,且避免了计算过程中可能发生的溢出现象,提高了计算结果的精度;两轮算法若取,计算结果的精度最高,但其计算量比其余两种方法大些。

置信区间:样本均值是数据位置的度量,也就是说,如果将数据画在X轴上,均值大致描述了观测中心在哪里;然而,在数据的分析中,还需要测量观测值的散布情况,而样本方差就是这样的度量。方差的平方根,即标准差提供了一种与X具有相同单位的度量。当总体为正态分布,平均数为,标准差时,大约95%的观测值可能介于之间。故在处理样本时,用来对样本总体进行估计。

样本方差分布:当总体为正态分布时,样本方差满足:


总体不是正态分布,但样本独立同分布时,虽然无法求出其具体分布,但可得出期望及方差如下:



式中为样本4阶中心矩。

设获得了如下三个样本。样本A:3,4,5,6,7。样本B:1,3,5,7,9。样本C:1,5,9。通过简单的计算可知,三个样本的均值都是5,即。样本容量分别为5,5,3。从而三个样本的样本方差分别为:




由上述计算知,虽然均值相同,但数据的分散程度越来越大。

  • 茆诗松,周纪芗.概率论与数理统计.北京:中国统计出版社,2000.
  • KOTZ S.Encyclopedia of Statistical Sciences.2nd ed.New York:John Wiley and Sons,2005.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!