异常观测值、异常值、野值是同义词,指表现异常、过大或过小的观测值。当观测者、仪器、环境出现异常变化或扰动时,都可能导致粗差和异常值。即使观测者、仪器和环境表现正常,被观测对象本身存在异常或与假定模型不一致时,也会导致异常观测值或粗差。如果是前者,在数据处理时需尽可能限制粗差或异常值对观测结果或待估参数的影响;如是后者,除前者目的外还需准确识别和定位异常值、粗差,并对其机制进行解释,以发现可能的科学新问题。科学史上一些新发现就是分析异常值获得的。
通常用描述正常观测的基础(基本)分布与描述异常值的扰动分布混合形成的污染分布模型来描述粗差。典型的粗差模型有均值移动模型和方差膨胀模型两种,前者认为粗差是由于函数模型误差所致,后者认为是随机模型误差所致。
粗差识别与处理方法:当存在大于某一阈值的误差或残差绝对值时,相应观测值是含有粗差的异常值,可用剔除法、抗差估计和/或稳健估计处理。阈值的确定具有一定主观性。当误差分布未知时,阈值可以取2.0、2.5、3.0倍标准差或其他值;误差分布分布已知时,可以根据0.010、0.025、0.050或其他小概率确定。