首页 . 工学 . 测绘学 . 遥感 . 高光谱遥感

波谱集群

/spectrum cluster/
最后更新 2024-12-05
浏览 105
最后更新 2024-12-05
浏览 105
0 意见反馈 条目引用

同一类地物,在波谱特征空间所呈现出相同影像亮度值的点群状分布。波谱集群也可以理解为谱聚类。

英文名称
spectrum cluster
所属学科
测绘学

聚类的直观解释是根据样本间相似度,将它们分成不同组。谱聚类的思想是将样本看作顶点,样本间的相似度看作带权的边,从而将聚类问题转为图分割问题:找到一种图分割的方法使得连接不同组的边的权重尽可能低(这意味着组间相似度要尽可能低),组内的边的权重尽可能高(这意味着组内相似度要尽可能高)。例如给你博客园上若干博客,就是将每一个博客当作图上的一个顶点,然后根据相似度将这些顶点连起来,最后进行分割。分割后还连在一起的顶点就是同一类。

为了能得到在任意形状的样本空间上聚类,且收敛于全局最优解,学者们开始研究一类新型的聚类算法,称为谱聚类算法(spectral clustering algorithm)。该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲和矩阵,并计算矩阵的特征值和特征向量,然后选择合适的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉、超大规模集成电路(VLSI)设计等领域,后开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,是一种点对聚类算法,对数据聚类具有很好的应用前景。

根据不同的准则函数及谱映射方法,谱聚类算法发展了很多不同的具体实现方法,但是都可以归纳为3个主要步骤:①构建表示样本集的矩阵;②通过计算的前k个特征值与特征向量,构建特征向量空间;③利用k-means或其他经典聚类算法对特征向量空间中的特征向量进行聚类。

上述步骤是谱聚类算法的一个框架,在具体实现过程中,不同的算法在数据集矩阵的表示上存在着不同。例如,根据2-way cut的目标函数,;根据随机游动关系,则等。

谱聚类算法是聚类分析中一个崭新的分支,由于这种算法不用对数据的全局结构作假设,并且具有识别非凸分布聚类的能力,非常适合于许多实际问题,因此在短短的几年时间内引起了国际学术界的广泛关注。谱聚类算法的研究将极大丰富聚类算法的研究内容,给聚类问题的求解提供了新的思路,具有巨大的科研价值和应用潜力。

  • 蔡晓妍,戴冠中,杨黎斌.谱聚类算法综述.计算机科学,2008,35(07):14-18.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!