您现在所在的位置:首页  备份  青春风采
战“疫”&科研——学术动态新分享(第一期)


零样本学习研究进展

近几年来深度学习在机器学习研究领域中取得了巨大的突破深度学习能够很好地实现复杂问题的学习,然而,深度学习最大的弊端之一,就是需要大量人工标注的训练数据而这需要耗费大量的人力成本因此为了缓解深度学习存在的这一问题,Palatucci2009年提出了零样本学习(Zero-shot learning)

零样本学习是迁移学习的一种特殊场景在零样本学习过程中训练类集和测试类集之间没有交集需要通过训练类与测试类之间的知识迁移来完成学习使在训练类上训练得到的模型能够成功识别测试类输入样例的类标签零样本学习的意义不仅在于可以对难以标注的样例进行识别更在于这一方法模拟了人类对于从未见过的对象的认知过程零样本学习方法的研究也会在一定程度上促进认知科学的研究鉴于零样本学习的应用价值理论意义和未来的发展潜力文中系统综述了零样本学习的研究进展首先概述了零样本学习的定义,介绍4典型的零样本学习模型并对零样本学习存在的关键问题及解决方法进行了介绍,对零样本学习的多种模型进行了分类和阐述并在最后指明了零样本学习进一步研究中需要解决的问题以及未来可能的发展方向。

【全文链接http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180429

1.概述

样本学习衍生于迁移学习是迁移学习的变种之一零样本学习与其他迁学习最主要的区别是训练类样本集和测试类样本集没有交集随着近年来的不断发展零样本学习已经逐渐脱离迁移学习成为一个独立的机器学习研究方向。零样本学习方法与现有的分类方法相比,具有如下三点优势:

1)对于某些还没有建立样本集的特定类(例如新定种的生物物种或濒危物种,最新设计的工业产品等),通过零样本学习,可以成功地对这些对象进行识别、分类,既能满足实际需求,又可以降低人工和经济成本。

2)零样本学习的核心机制与人类的学习机制有很多的共通之,对于零样本学习进行深入的研究,会为人类认知科学领域提供强有力的帮助。

3)零样本学习与深度学习并不矛盾,两者可以有机结合、博采众长、融合发展,从而更好地满足未来对象识别领域的需求。

零样本学习目前虽然有多种模型,但在本质上都是相似的。而且,零样本学习并不是完全不需要训练样本零样本学习专注于研究对于特定的某些类缺失对应的训练样本但模型在使用其他类的训练样本训练后仍然可以对这些特定类的输入做出预测的情况一般来说零样本学习中对象类集合应分为两种训练类(又称已见类)和测试类(又称未见类)。零样本学习的基本思想是利用训练集中的样本,和样本对应的辅助信息(例如文属性征等)训练,在用在练过中得到的信息,及模的测试类辅助息对型进行补使得模能够成功测试集中的样例进行分类。目前来看,零样本学习的研究仍然处于发展阶段,还没有明确一致的定义,因此为了更清晰地阐述零样本学习问题,本文对零样本学习定义如下零样本学习如果模型在训练过程中,只使用训练类的样本进行训练,且在测试阶段别从该模型实本学习。

2.零样本学习的典型模型

零样本学习在2009年正式提出之前,经有多位学者对这领域进行了一系列深入研究。零样本学习发展过程中,具有重要节点意义的4种模型

分别是新任务的零数据学习语义输出编码零样本学习基于属性类间迁移的未见类学习、以及跨模态迁移的零样本学习。

2.1新任务的零数据学习

零数据学习的目标在于如何构造模型学习没有可用的训练数据、且只有类

描述的分类器题。因此,在定上,数据学习与零本学习本质上是同的并有两种学习方法输入空间方法和模型空间方法这两种方法为之后的零样本学习的发展指出了具有启发意义的方向。

2.2语义输出编码零样本学习

 2009年,Palatucci等首次提出“零样本学习”这一概念并提出利用语义输出编码(Semantic output codeSOC)分类器以及包含大量语义知识的标签库,将训练模型的分类能力推广到测试类上实现零样本学习首先定义一个维的语义特征空间,每个维度都对应一个二值编码特征例如,对于“狗”这一类标签来说,在“多毛”、“有尾巴”、“水下呼吸”“肉食性”和“可以快速移动”5条语义特征下的语义空间中,“狗”这一类可以利用布尔值表示为语义特征向[11011],这一表示方法与Dietterich等提出的方法在思路上较为相似。

2.3基于属性类间迁移的未见类学习

上一模型中所提到的语义编码,本质上是与类相对应的属性特征编码根据人类认知科学的研究,人类在遇到从未见过的对象时,也会首先判断对象的特征属性,从而与自身的先验知识相结合,做出其所属类别的判断。

但在2009年之,大多数学者所关注的属性仍然较为简,仅仅考虑了图像中的几何形状以及颜色等属性。Farhadi2009也提出了通过语义属性预测对象类标签的模型,实现了对类附加特定的属性描述,并将属性泛化到不同的类中。年,Lampert等提出基于间迁移的见类检测方,这一模型可谓是零样本学习的奠基之,现样本习方都继承了该模型思想。

2.4跨模态迁移的零样本学习

跨模态迁移的零样本学习由Socher等于2013年提出,该方法的意义在于首次将零样本学习问题转化为子空间问题。从2013年开始,有很多学者延续了将零样本学习问题转化为子空间问题这一思路,基本上他们都是受到了这篇论文的影跨模态迁移学习的核心思想是将图像和类标签同时映射到相同的子空间内,目前通常是将图像类标签同时映射(或称为嵌入(Embedding))间中,并在语义空间内,利用一定的相似性度量方法,去确定测试类输入图像的类标签。这一部分中所说明的这4种模型在零样本学习的形成阶段奠定了零样本学习的基础,但由于当时的局限性,这4种模型仍然有不可忽视的缺点新任务的零数据当时只给出了“模空间方法和“输入空间方法”的概念,两种方法的具体细节并没有给出,这两种方法的意义在于为零样本学习指出了概念上的实现方向语义输出编码模型虽然首次提出了零样本学习这一概念,但这一方法与后来的零样本学习方法相比过于简陋只是使用训练后得到的矩阵将图像特征线性映射到语义空间中,实验效果较差。基于属性的类间迁移模型首次正式地将“属性” 这一概念引入零样本学习并希望以此实现较为准确的测试类识但由于该方法使用属性分类器对测试类进行识别导这致其对于属性的识别准确度较高,对于测试类的识别准确度却较低跨模态迁移模型首次将零样本学习问题考虑为征子的映射问,这意义开创本学习的发展间,但这一方法也带来了零样本学习中最为关键的问题之,映射域偏移问,在训练类上训练的映射模型在映射测试类样例时产生的偏差,会显著影响零样本学习模型的识别准确度。

3.零样本学习关键问题

虽然目前来说零样本学习仍处于快速发展的阶段,前景十分可期,但零样本学习自身方法中存在的问题使得前进道路上横亘着三个无法忽视的障碍这三个障碍分别是广义零样本学Generalized zero-shot learning、枢纽度问Hubness)、映射域偏移问题(The projection domain shift problem)。

3.1广义零样本学习

在实际应用中,目前的零样本学习与现实应用的学习环境出现了一定程度的矛盾,这是因为零样本学习中假“零样本学习在测试阶,只有未见类样例出

现。”这在实际应用中是不现实的,已见类的对象往往是现实世界中最为常见的对象,而且,如果在训练阶段已见类样本容易得到、未见类样本难以获取,那么在测试阶段就也不应只有未见类样例出现。所以,为了让零样本学习真实反应实际应用中的对象识别场景,零样本学习模型应对所有输入样例进行识别,即少量的未见类样例夹杂在大量的已见类样例中,输入样例的可能类标签大概率属于已见类,但也有可能属于未见类。

3.2枢纽度问题

枢纽化问题(Hubness)并不零样学习特有的,所有利特征空间的机器学习模型,都在实验中发现了这一现象,维度越高,这一现象愈发明显,在嵌入空间中,这一问题尤为严重。而且由于目前零样本学习最为流行的方法就是将输入样例嵌入到特征子空间致了样本中的枢纽问题为突出。枢纽化问题最早是在2010年由 Radovanovi等提出,这一问题是指将原始空(例如图特征空间或类标签空间)中的某个元素映射到特间中,得到始空间中某个素的特征空间的新,这时如果使K近邻方法进行相似性度量,可能会原始间中元素映射到多个试样空间中表示最个近,而关向量就称(hub)”,枢纽的出现污染了测试类的近邻列表,对零样本学习产生了较大的影响

3.3映射域偏移问题

映射域偏移问题的根源在于映射模型较差的泛化能力:模型使用了训练类样本学习由样例特空间

间的射,于没有测试类样本可用于训练,因此,在映射测试类的输入样例时,就会产生一定的偏差。

供稿:于路

编辑:张梓汶