其中为
维的向量,
是第
个高斯分布
的权重,且
,
和
是高斯分布
的参数,即均值向量和协方差阵。
通过增加不同高斯分布的数量,高斯混合模型(GMM)可以平滑任意形状的概率分布,也就是说任意形状的概率分布都可以用多个高斯分布函数去近似,其参数求解方法一般使用EM(最大期望值)求解方法。EM算法分两步,E步估计隐含变量,M步估计其他参数
和
,交替将极值推向最大。通常,类似于
-means聚类算法,高斯混合分布中
的个数需提前给定。
单一高斯概率密度函数的延伸,是用多个高斯概率密度函数(正态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(正态分布曲线)分布的统计模型。