首页 . 理学 . 统计学 . 描述统计 . 数据变换

重心距离法

/centroid distance method/
条目作者孙志猛

孙志猛

最后更新 2023-06-30
浏览 223
最后更新 2023-06-30
浏览 223
0 意见反馈 条目引用

将两类间的相似程度定义为两类重心间距离的一种系统聚类分析方法。

英文名称
centroid distance method
所属学科
统计学

“重心”源于物理学中的重心概念,在系统聚类中,重心距离法采用重心之间的距离定义类与类之间的相似程度。当对样本分类时,每一类的重心就是属于该类的样本均值。虽然重心指标对类有很好的代表性,但利用各样本的信息不够充分。

设某一步骤将类和类合并成一个新类,记为所包含的样本个数分别为的重心分别为则有:


设某一类的重心为,它与新类的距离:


如果样本间的距离定义为欧式距离,则有


式(3)为当样本间距离取为欧氏距离时,合并后新类与其他类距离平方的递推公式,如果样本间距离不是欧式距离,则需根据情况计算出相应的递推公式。

与最短距离法与最长距离法等系统聚类方法相比,重心距离法的优点在于用均值取代了极值,在处理异常值时算法较稳健,从而弥补了最短距离法与最长距离法的不足之处,适合于样本间差异比较大的情况下使用。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!