展开全部 +
首页 . 管理学 . 管理科学与工程 . 大数据与知识管理 . 大数据 . 数据科学 . 数据挖掘

图挖掘

/graph mining/
条目作者石勇田英杰
条目作者石勇

石勇

田英杰

田英杰

最后更新 2023-02-04
浏览 267
最后更新 2023-02-04
浏览 267
0 意见反馈 条目引用

使用数据挖掘技术,从图结构数据中发现有用信息的过程。

英文名称
graph mining
所属学科
管理科学与工程

图挖掘是图论和数据挖掘的交叉领域。传统的数据挖掘任务,如分类、聚类等,都是从服从独立同分布的样本集合中寻找有用的模式。而许多数据中的实体常常存在连接关系,这些关系信息可以用于增强数据挖掘的效果。这些连接关系可以通过图来表达。图定义为一个带有节点集合和边集合的二元组结构作为一种通用的数据结构,图可以建模数据间的复杂关系。

图挖掘的研究包含许多方面。其中基础研究包括图的匹配、频繁子图挖掘、关键字查询等。针对图的不同部分,有基于节点的方法,如节点聚类、节点分类等;有基于边的方法,如边分类、链接预测等;也有基于子图的方法,如社区发现、图匹配等。

图挖掘的常用技术有以下几种:①图聚类,此类任务是要结合图内边(edge)的连接情况,将图的顶点(vertices)分到若干个不同的簇别中去,从而使得簇内各顶点之间具有较多的边连接,而簇间的各顶点之间具有较少的连接。图聚类是一种无监督的学习方法,簇的个数是未知的。最后聚类得到的簇主要反映的是图数据中某些潜在的相似性。②图分类,此类任务针对的是多个图组成的数据集,图分类就是将单个图划分到两个或者多个类别中。图分类是一种有监督的学习方法。类别种类是已知的。③子图挖掘,如果A图的边和顶点是B图边和顶点的子集,则称A图为B图的子图。最常见的子图挖掘就是从若干个输入样本图中产生一系列子图,这些子图的出现的次数满足一定的阈值。

图挖掘可以应用到任何带有图结构的场景中,常见的包括社交网络分析、生物网络分析、网络结构挖掘等。

①社交网络分析。社交网络包含用户和用户关系,社交网络分析通过图挖掘来发现其网络结构。通过机器学习、统计学习等方法,可以对网络用户进行分类和聚类,通过图论中随机游走、扩散理论等方法,可以分析社交网络中的信息传播、异常检测和病毒式营销等。

②生物网络分析。分析图挖掘技术在生物网络中最主要的应用是用于发现生物序列中频繁出现的模式。随着生物技术的发展,诸如蛋白质相互作用网络、基因调控网络等也可使用图结构来表示。图挖掘技术可以更加广泛地应用确定化学化合物的子结构、找到DNA的子序列等领域。在医学领域里,图挖掘技术还可用于从病人的历史医疗记录中发现诊断规则。

③网络结构挖掘。网站之间的链接关系也可以通过图来表示,图挖掘可以从网页链接中挖掘出有用的信息,从而用于用户的网页浏览模式、对网页进行排序、建立用户喜好画像、推荐系统等。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!