为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自西北工业大学和西安电子科技大学的零样本目标检测方面的工作。该工作由韩军伟、张鼎文和程德教授指导,论文第一作者黄培亮博士生录制。 论文题目:Robust Region Feature Synthesizer for Zero-Shot Object Detection 作者列表:黄培亮 (西北工业大学),韩军伟 (西北工业大学),程德 (西安电子科技大学),张鼎文 (西北工业大学) B站观看网址: https://www.bilibili.com/video/BV1QY4y1W7rU/ 复制链接到浏览器打开或点击阅读原文即可跳转至观看页面。 论文摘要: 零样本目标检测旨在结合类语义词向量来实现对不可见类的检测。在本研究中,我们揭露了该研究领域的核心挑战:如何合成与真实样本一样具有类内多样性和类间可区分性的鲁棒区域特征 (对于不可见类目标),以便利用这些特征来训练强大的不可见类目标检测器。为了解决这些挑战,我们构建了一个新颖的零样本目标检测框架,其中包含一个类内语义发散组件和一个类间结构保留组件。前者用于实现一对多的映射,从每个类语义向量中获取不同的视觉特征,从而防止将真实的看不见的物体误分类为图像背景。而后者用于避免合成特征过于分散而混淆类间以及前景-背景之间的关系。为了证明所提方法的有效性,我们在PASCAL VOC, COCO, 以及DIOR数据集上进行了全面的实验。值得注意的是,我们的方法在 PASCAL VOC 和 COCO 上实现了最先进的性能,并且是第一个在遥感图像中进行零样本目标检测的研究。 论文信息: [1] Huang P, Han J, Cheng D, et al. Robust Region Feature Synthesizer for Zero-Shot Object Detection. CVPR 2022. 论文链接: [https://arxiv.org/pdf/2201.00103.pdf] 代码链接: [https://github.com/HPL123/RRFS] 视频讲者简介: 黄培亮,西北工业大学博士生。博士期间研究方向为计算机视觉和图像处理,主要专注于非平衡监督信息下的目标检测与分割等任务。 特别鸣谢本次论文速览主要组织者: 月度轮值AC:赵文达 (大连理工大学)、任文琦 (中山大学) 季度责任AC:魏秀参 (南京理工大学) 活动参与方式 1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们! 直播地址: https://live.bilibili.com/22300737; 历史视频观看地址: https://space.bilibili.com/562085182/ 2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ R群,群号:137634472); *注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。 3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。 4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。 |
小黑屋|手机版|Archiver|Vision And Learning SEminar
GMT+8, 2024-11-22 03:37 , Processed in 0.012491 second(s), 14 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.