若随机变量取不超过实数
的值这一事件的概率为:
式中、
为实参数,且
>0,则
的分布称为(一维)正态分布或高斯分布,记作
。它是具有密度函数
的连续型分布。
正态分布最早由A.棣莫弗(1730)在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.-S.拉普拉斯和高斯研究了它的性质。
生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降雨量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是直接由它导出的,例如对数正态分布,分布、
分布和
分布。
正态分布的密度函数
的图像是一条位于
轴上方的钟形曲线(图1),它在
处达到最大值,而且关于
对称;
越小,分布越集中在
附近,
越大,分布越分散;曲线在离
较远处很快接近于0。若随机变量
遵从正态分布
,则
≈95.45%,
≈99.73%;它的数学期望、方差与特征函数分别是
,
。
图1 正态分布N(μ,α2)的密度函数φ(x;μ,σ)(σ1<σ2<σ3)
当,
时,即
,称为标准正态分布,其密度函数及分布函数分别为:
及
若随机变量遵从分布
,则
遵从分布
,而且
。由于有这种关系,在应用中只需对
编造各种数值表供查。
对于多维正态分布,对维随机向量
,其
维正态分布是以
为密度函数的连续型概率分布,记作或
,其中
是
维欧几里得空间
中的点,
,
表示
的转置;
和
分别表示
正定对称矩阵
的行列式和逆矩阵。二维正态分布的密度函数通常写成如下形式(即在前式中
,又在
中,令
):
式中,其图像如图2。
的特征函数是:
当为退化的非负定矩阵时,
不存在;但根据特征函数与分布函数相互唯一确定的定理,仍可将
定义为以上述
为特征函数的
维概率分布,这时它不存在密度函数,称为
维退化正态分布,它的质量集中在某个
维子空间上,
是矩阵
的秩。由多维正态分布也可导出其他一些重要的多维分布,如威沙特分布,T2分布等。
多维正态分布有以下的性质:设有概率分布
,则
,
是
的协方差;
的任何边缘分布仍然是正态分布;
独立的充分必要条件是
,对一切
成立;设
为任一
实矩阵,则
维随机向量
遵从正态分布
,其中
为
的转置;特别,遵从分布
的随机变量
,
,若相互独立,则它们的和
遵从分布
。
维随机向量
遵从
维正态分布的充分必要条件是它的任一线性组合都遵从正态分布。