为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自电子科技大学的图像目标检测方面的工作。该工作由李宏亮教授指导,论文第一作者邱荷茜同学录制。 论文题目:CrossDet: Crossline Representation for Object Detection 作者列表:邱荷茜 (电子科技大学),李宏亮 (电子科技大学),吴庆波 (电子科技大学),崔建华 (电子科技大学),宋子辰 (电子科技大学),王岚晓 (电子科技大学),张敏健 (电子科技大学) B站观看网址: 论文摘要: 目标检测任务 (Object detection)通常依赖于对象表示去预测目标的位置和类别。因此,一个精准有效的对象表示是目标检测成功的关键因素。现有的方法通常使用矩形的锚点框或一系列的离散点去表示对象。然而,这些方法容易引入背景噪声以及丢失目标内部连续的外观信息,从而导致错误的检测结果。取代传统的基于锚点框和点的对象表示,我们首次提出一个新颖的十字线表示的无锚点目标检测网络CrossDet,采用一组自动生长的十字线去表示对象。一方面,一个对象被灵活地表示以不同地组合形式,能够有效地提取对象特征,减少噪声的干扰。另一方面,考虑连续的对象特征信息,有助于感知对象特征的变化,从而找到目标的边界。基于可学习的十字线,我们构建了十字线提取模块去自适应的整合十字线的特征。该模块首先在水平和竖直的两个维度分别执行平均池化操作,编码轴感知的长范围上下文特征,然后选择性地采样十字线上的特征,捕获具有判别性的特征。在优化过程中,我们进一步设计了解耦的回归机制,分别沿着水平和竖直方向回归目标位置,限制优化空间为某个具体的方向,有助于缓解优化难度。最后在Pascal VOC以及大规模的MS-COCO数据库进行了实验验证,实验结果表明该方法能够更有效地表示复杂多变的对象,提升目标检测准确性。 论文信息: [1] Heqian Qiu, Hongliang Li, Qingbo Wu, Jianhua Cui, Zichen Song, Lanxiao Wang, and Minjian Zhang. "CrossDet: Crossline Representation for Object Detection." Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), pp. 3195-3204, virtual, October 2021. 论文链接: [https://openaccess.thecvf.com/content/ICCV2021/papers/Qiu_CrossDet_Crossline_Representation_for_Object_Detection_ICCV_2021_paper.pdf] 代码链接: [https://github.com/QiuHeqian/CrossDet] 视频讲者简介: 邱荷茜,电子科技大学博士生,研究方向为计算机视觉和图像处理,目前专注于目标检测和多模态语言与视觉解析和定位。 特别鸣谢本次论文速览主要组织者: 月度轮值AC:杨曦 (西安电子科技大学)、王鑫 (清华大学) 季度责任AC:杨猛 (中山大学) 活动参与方式 1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们! 直播地址: https://live.bilibili.com/22300737; 历史视频观看地址: https://space.bilibili.com/562085182/ 2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ R群,群号:137634472); *注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。 3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。 4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。 |
小黑屋|手机版|Archiver|Vision And Learning SEminar
GMT+8, 2024-11-22 03:07 , Processed in 0.012658 second(s), 14 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.