首页 . 理学 . 计算机科学技术 . 人工智能 . 机器学习 . 弱监督学习

多示例学习

/multi-instance learning/
条目作者张敏灵

张敏灵

最后更新 2022-01-20
浏览 99
最后更新 2022-01-20
浏览 99
0 意见反馈 条目引用

表示单个示例的维特征空间,表示正负类别标记,多示例学习的数据集可表示为,式中是由个示例组成的示例包,且,多示例学习的目标是从多示例数据集中学习一个分类器,能够对未知的示例包进行有效的分类。

英文名称
multi-instance learning
所属学科
计算机科学技术

多示例学习的研究起源于20世纪90年代中期进行的药物活性预测问题,该研究通过对制药分子进行分析,尽可能正确地预测某种新的分子是否适合制造这种药物。研究人员发现该问题的困难之处在于,每一个分子有很多种可能的低能形状,专家只知道哪些分子适于制药,并不知道具体的哪一种形状起到了决定性作用,针对这种情况,研究人员将每个分子作为一个样本包,将分子的不同低能形状作为一个样本包中的多个示例,从而提出了多示例学习的概念。在多示例学习中,如果一个训练包至少有一个示例为正标记,则该包被标记为正;如果一个训练包中的所有示例都为负示例,则该包被标记为负。与传统的监督学习方式相比,多示例学习的训练数据集中是含有歧义性信息的,而监督学习中每个示例都对应于一个明确的标记;与非监督学习相比,虽然多示例学习训练集中的每个单个示例都没有明确的标记对应关系,但是由不同示例组成的样本包都有各自对应的标记类别,因此多示例学习可以被看作一种特殊的弱监督学习范式。

自从多示例学习框架被提出后的20多年来,已有多种方法和思路被用来解决这一问题。由于多示例学习中监督信息是以示例包为基本单位给出的,所以求解这一问题的难度主要来自所采用的对象表示形式,从对象的表示形式这一角度来看,已有的多示例学习算法可以大致被分为2类:基于示例空间表示的、基于包空间表示的和基于嵌入空间表示的学习算法。基于示例空间的学习算法先在示例层次上学习一个分类器,以单个示例的特征向量作为输入进行标记预测,然后结合分类器对于一个示例包内的所有单个示例的预测输出,从而得到关于该示例包的最终标记预测;基于包空间的学习算法将一个示例包内的所有示例作为一个整体,通过定义示例包之间的距离度量或核函数,从而在示例包层次进行建模,例如可以利用近邻算法进行标记的预测;基于嵌入空间的学习算法通过特征变换将一个示例包作为整体嵌入到一个新的特征空间中,从而把多示例学习问题转化为新的特征空间中的标准二分类问题,然后利用一些常用的机器学习方法进行训练和预测。

除了用于药物活性方面的研究,多示例学习在计算机视觉方面也有着很多实际应用。由于图像通常由多个可以对应实际物体对象的区域组成,即一幅图像可以表示成由多个示例组成的样本包,因此多示例学习的方法和思路被不断用于各种弱监督场景下的图像分类、物体识别、图像语义分割、视觉追踪等应用中,同时多示例学习在计算机视觉方面的成功应用也促进了多示例学习算法在深度学习时代的发展。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!