发布网友 发布时间:2022-05-27 16:40
共1个回答
热心网友 时间:2023-11-04 07:31
多示例学习中,定义“包”为多个示例的集合。与其他Classification方法不同,此方法仅对“包”作标签,“包”中的示例并无标签。定义“正包”:包中至少有一个正示例;反之,当且仅当“包”中所有示例为负示例时,该“包”为“负包”。
多示例学习的目的:①归纳出单个示例的标签类别的概念。②计算机通过对这些已标注的“包”学习,尽可能准确地对新的“包”的标签做出判断。
我们就拿图像分类举个例子:图像分类是基于图像内容来确定图像目标的类别。例如:一张图片上存在“sand”、water等各种示例,我们研究的目标是beach。在多示例学习中,一张图像作为一个“包”:。是特征向量(也就是我们所说的示例),是从图像中对应的第i个区域中提取出来的,总共存在N个示例区域。那么,“包”中当且仅当sand和water都存在时,此“包”才会作上“beach”标签。显然,利用这种方法来研究图像分类就考虑到了图像中元素之间关系,相比单示例方法在某些情况下得出的分类效果更好。
多示例学习方法是20世纪90年代人们在研究药物活性时提出来的。1997年,T. G. Dietterich 等人 对药物活性预测问题进行了研究。其目的是构建一个学习系统,通过对已知适于或不适于制药的分子进行学习,尽可能正确地预测其他新的分子是否适合制药。由于每个分子都有很多种可能的稳定同分异构体共存,而生物化学家目前只知道哪些分子适于制药,并不知道其中的哪一种同分异构体起到了决定性作用。如果使用传统的有监督学习的方法,将适合制药的分子的所有稳定同分异构体作为正样本显然会引入很多噪声。因此,提出来多示例学习的问题。
多示例学习自提出十几年以来,一直成为研究的热点。从最初T. G. Dietterich等人 提出该方法时给出的三个基于轴平行矩形的方法,到后来的DD、EMDD、Citation-kNN,以及SVM、神经网络、条件随机场方法在多示例学习中的运用。
多示例学习具有广泛的应用,例如:图像检索、文本分类等。