少样本学习新突破!创新奇智入选ECCV 2020 Oral论文
近日,少样创新奇智有关少样本学习(Few-shot Learning)的本学研究论文《Prototype Rectification for Few-Shot Learning》被全球计算机视觉顶会ECCV 2020接收为Oral论文,入选率仅2%。习新
ECCV全称为European Conference on Computer Vision(欧洲计算机视觉国际会议),突破与ICCV和CVPR合称为全球计算机视觉三大顶级会议,创新每两年举办一次。奇智据大会官方介绍,入选本届会议共收到5025份有效投稿,论文共接收1361篇,少样录取率为27%,本学其中1361篇接收论文里面,习新有104篇Oral以及161篇 Spotlight,突破分别占比2%和5%,创新堪称史上最难ECCV。奇智
创新奇智CTO张发恩表示:“当前的入选深度学习技术对数据具有极大依赖性,如何减小数据依赖,利用较少的数据取得理想的识别效果成为当下亟待突破的技术难点。少样本学习旨在从已有类别的数据中学习先验知识,然后利用极少的标注数据完成对新类别的识别,打破了样本数据量的制约,在传统制造业等样本普遍缺失的领域具有实用价值,有助于推动AI落地。”
创新奇智本次发表的论文指出,少样本学习的瓶颈在于数据稀缺引起的偏差,主要包括类内偏差和跨类偏差,并提出相应方法有针对性地减小两项偏差,该思路经过严格的理论证明其合理性,并通过大量实验证明了方法的有效性,在少样本学习通用的数据集中达到了最优的结果。
以下为论文解读:
(论文初版arXiv地址为:https://arxiv.org/abs/1911.10713 。 后续Camera Ready版本将于近日更新,补充了更多数据集上的表现。
1、概述
少样本学习(Few-shot learning)旨在从大量有标注数据的类别中学习到普遍的规律,利用学习到的知识,能够使用少量的有标注数据(如一张或五张)完成对新类别的识别。原型网络是少样本学习中一类非常有效的方法,其针对不同的类别提取出对应的类原型,然后根据样本与类原型之间的距离进行分类。由于新类别的样本数量极少,原型网络所计算出的类原型存在一定的偏差。本文指出了制约原型网络效果的两个关键因素:类内偏差和跨类偏差,并且提出利用伪标签的方法减小类内偏差,利用特征偏移的方法减小跨类偏差,进一步通过理论分析指出原型网络准确率的理论下界,证明伪标签的方法可以提高理论下界从而提高整体准确率,最后,实验结果表明,本文的方法在miniImageNet和tieredImageNet上达到了最高水平的结果。
主要贡献
本文指出了原型网络在少样本学习中的两项制约因素:类内偏差(intra-class bias)及跨类偏差(cross-class bias)。
本文利用伪标签和特征偏移,进行原型校正和减小偏差,简单有效地提高了少样本分类的表现。
本文分析了理论下界与样本数量之间的关系,从而验证了所提方法的合理性,并给出了偏移量的推导过程。
本文所提出的方法在通用的少样本数据集miniImageNet和tieredImageNet上达到了最优的结果。
2、方法
2.1 基于余弦相似度的原型网络(CSPN)
本文利用基于余弦相似度的原型网络(Cosine Similarity Based Prototypical Network,CSPN)得到少样本类别(few-shot class)的基础类原型。
首先在基础类别(base class)上训练特征提取器和余弦分类器,余弦分类器定义如下:
其中Fθ是特征提取器,W 为可学习权重,τ为温度参数。在模型训练阶段使用如下损失函数:
预训练结束后,使用下式得到few-shot class的基础类原型:
2.2 原型校正中的偏差消除(Bias Diminishing for Prototype Rectification)
在样本较少的情况下,比如K=1或K=5,计算所得基础类原型与理想的类原型之间存在一定偏差,减小偏差可以提高类原型的表征能力,从而提高分类准确率,本文指出如下两种偏差以及对应的减小偏差的方法。
类内偏差(intra-class bias)
即真实类原型(第一项)和使用少量样本计算的类原型(第二项)之间的偏差。真实的类原型往往是不可得的,可得的是利用少量有标注的数据集(support set)计算得到的类原型,为了减小这两项之间的偏差,本文提出利用无标注的数据集(query set)重新计算类原型。首先通过计算query set中的样本与基础类原型之间的余弦相似度获得query sample的伪标签,然后将top-z confident的query sample加入support set中,并根据下式重新计算,得到修正后的类原型P'n:
跨类偏差(cross-class bias)
即整个有标注数据集support set和无标注数据集query set之间的偏差。为了修正跨类偏差,本文在无标注数据中加入偏移量ξ, ξ的具体计算方式如下:
2.3 理论推导Theoretical Analysis
本文通过以下理论推导,解释了上述方法的合理性以及该方法是如何提高少样本分类表现的。
理论下界
在原型网络中,假设最终的准确率与类原型和样本间余弦相似度之间呈正相关,即最终优化目标可以表示为:
再结合使用一阶近似、柯西施瓦茨不等式等方法进行推导验证,可以得到模型的理论下界:
可以看出模型最终效果和样本数之间呈正相关,因此可以通过引入无标签样本来提高模型理论下界,即增大T 可以提高模型表现。
有关偏移量ξ的推导过程详见论文,在这里就不敷述了。
3、实验
3.1实验结果
本文在少样本学习的两个公开数据集 (miniImageNet, tieredImageNet) 上进行了实验,与其他方法相比,本文提出的BD-CSPN在1-shot及5-shot的设置下均达到了最佳效果。
3.2消融实验
本文通过消融实验进一步验证了模型每一部分的有效性。
表中从上到下分别为:不使用原型修正的方法,单独使用跨类偏差修正,单独使用类内偏差修正以及同时使用类内偏差和跨类偏差修正的结果,可以看到减小偏差对最终结果有明显的提升。
本文进一步分析了原型校正中无标注样本的样本数量对于最终结果的影响,如图2(a-b)所示,随着无标注样本的增多最终效果有持续的提升,图2(c)中虚线为通过计算所得到的理论下界,可以看到本文的实验结果和理论相符。
本文采用不同的网络结构作为特征提取器,验证了原型校正的方法在不同网络结构下均有明显提升。
总结
本文提出一种简单有效的少样本学习方法,通过减小类内偏差和跨类偏差进行原型校正,从而显著提高少样本分类结果,并且给出理论推导证明本文所提方法可以提高理论下界,最终通过实验表明本方法在通用数据集中达到了最优结果,论文被ECCV 2020 接收为Oral。本文中提出的算法已经在创新奇智的实际场景中落地应用,可以从海量非结构化数据中根据极少数种子数据(1张至5张)挖掘出所需要的同类数据,可以极大的提升数据收集速度和准确率,降低成本。
雷锋网雷锋网
-
文章
213
-
浏览
464
-
获赞
17744
热门推荐
-
国足吉达首训未安排分组对抗 封闭条件不理想保守战术秘密
国足吉达首训未安排分组对抗 封闭条件不理想保守战术秘密_训练基地www.ty42.com 日期:2021-10-11 11:31:00| 评论(已有306363条评论)首都机场飞机监护员牛雯露:不浪费的青春才更有意义
青春像春风,让人沐浴在清爽中;青春像夏日的酷暑,让人又爱又恨;青春像秋收的果实,硕大而丰美;青春又像冬日的那飘零的白雪,让人遐想无限。青春对每个人来说都是值得回味、值得纪念的,在首都机场的停机坪上有这加强培训 引领服务——青海分局气象台预报室开展天气服务培训
中国民用航空网通讯员田维东讯:近日,民航青海空管分局气象台预报室组织全体预报员开展天气服务培训,针对前期与管制部门复盘分析中发现的问题开展了个例分析讲解。近年来,西宁曹家堡国际机场航班量大幅增加,风切浙江空管分局与浙江警务航空队联合组织实地交流学习
浙江空管分局与浙江警务航空队联合组织实地交流学习通讯员董侃、孙宇鹏)一个是守护人民群众安全的警务航空飞行员,一个是指挥飞机起落的空中交通管制员,他们都是国家与人民安全的守护者。对于外界,他们的工作是神阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿
潮牌汇 / 潮流资讯 / 阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿2020年02月17日浏览:3454 为迎接贝壳头诞生 50 周年,从去年真抓实干,筑牢三基
中国有句俗话,叫做“根基不牢,房倒屋摇”,任何行业、任何工作,基础建设是重中之重,不抓基础建设而想要得到好的成就和结果,那都是无根之木、无源之水,空中楼阁而已。民航业作为国民经济中的重要组成部分,一向合作交流 资源共享——技保中心导航室完成银川机场导航培训平台技术支持
近期,西北空管局技保中心导航室积极提供导航专业技术支持,圆满完成西部机场集团在银川搭建的导航培训平台测试验证和交流学习工作。西部机场集团于2019年5月份搭建了银川河东机场Normarc 7000B下南航货运组织志愿者迎战节前小高峰
通讯员:吴岳)端午节来临,航空货邮、行李迎来小高峰。6月4日至6日,南航新疆货运组织志愿者走上机坪,协助机下装卸,助力旺季生产。据了解,端午节前夕南航货运水果类货物增量明显,乌鲁木齐至北京、广州、上海《辐射》真人剧集第二季将于11月开拍
亚马逊Prime Video热门剧集《辐射》第二季消息来了,据第一季女演员Leslie Uggams透露,《辐射》第二季将于11月正式开始拍摄,这意味着几周后所有人就会回到片场。Leslie Ugga华北空管局通信网络中心完成石家庄甚高频传输链路升级改造
通讯员 刘洋)北京区管中心使用的石家庄甚高频台作为重要的地空通信保障台站之一,为区管中心提供8路甚高频频率信号。原有的地面传输路由采用BAYLY PCM设备,通过联通2M专线传输。为解决甚高频传输路由大连空管站导航设备室排除供电线路安全隐患
为了保障暑运期间供电系统的运行安全,贯彻落实上级关于安全保障的工作要求,围绕“安全生产月”活动“防风险、防隐患、遏事故”的主题宗旨,6月10日,大连空管站技术保障部导航设备室排除西山雷达站供电线路安全他权倾朝野 却偏偏选一个弱智儿子做了太子!
泰始三年(公元267年)正月,弘农,渑池两地出现了两条白龙,白色,可是晋朝的国色。几天后,大晋迎来了它的太子,司马衷。这孩子后来说出一句名言,——“何不食肉糜”?这位皮蛋瘦肉粥的推荐者,脑子不太灵光,《星球大战9:天行者崛起》续集电影的编剧又走了
《星球大战9:天行者崛起》电影续集失去了自己的编剧Steven Knight。这部续集由莎梅·奥贝德-奇诺伊Sharmeen Obaid-Chinoy)执导,《星战》新三部曲电影女主黛茜·雷德利主演。青海分局三个支部组织党员干部开展台站服务调研及慰问活动
中国民用航空网通讯员晁宝山讯:5月31日,青海空管分局机关1支部、后勤服务公司党支部、工程指挥部党支部组织党员干部开展了台站服务调研及慰问活动。活动中,机关各部室、后勤服务公司、工程指挥部党员干部前往浙江空管分局与浙江警务航空队联合组织实地交流学习
浙江空管分局与浙江警务航空队联合组织实地交流学习通讯员董侃、孙宇鹏)一个是守护人民群众安全的警务航空飞行员,一个是指挥飞机起落的空中交通管制员,他们都是国家与人民安全的守护者。对于外界,他们的工作是神