为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自西北工业大学的在线动作检测方面的工作。该工作由韩军伟教授和张鼎文教授指导,论文第一作者杨乐博士录制。 论文题目:基于样例查询的在线动作检测 作者列表:杨乐 (西北工业大学)、韩军伟 (西北工业大学)、张鼎文 (西北工业大学) B站观看网址: 论文摘要: 时序动作定位任务致力于从漫长的视频中发现有意义的动作片段,并标注起止时间和动作类别。在实际应用中,算法需要在线地处理视频流并及时准确地检测出正在发生的动作,这将传统的时序动作定位任务发展为新兴的在线动作检测任务。已有方法通常在一个视频片段内部精细地建模时序依赖,从而进行在线动作检测。这种学习范式会导致两个问题:(1) 即使两个动作实例属于同一类别,他们可能由于来自不同视频而无法进行信息交互。(2) 训练过程希望为每类动作学习特定的一种表征,但同类动作的不同阶段通常具有较大的差异性。为应对上述两点挑战,本文提出样例查询机制,在动态样例分支中,通过比较时序样例和当前帧的相似性,以一种简单高效的方式建模时序信息;在静态样例分支中,通过比较类别样例和当前帧的相似性,能进行跨视频信息交互并为每类动作学习多样性的表征。相比已有方法,所提方法效率更快,检测精度更高,能为后续在线动作检测研究提供简单有效的基准模型。 论文信息: [1] Le Yang, Junwei Han, and Dingwen Zhang. "Colar: Effective and Efficient Online Action Detection by Consulting Exemplars". Proceedings of the IEEE/ CVF Conference on Computer Vision and Pattern Recognition. 2022. 论文链接: [https://arxiv.org/abs/2203.01057] 代码链接: [https://github.com/VividLe/Online-Action-Detection] 视频讲者简介: 杨乐,西北工业大学博士生,研究方向为计算机视觉和图像处理,目前专注于在线动作检测、时序动作定位和视频目标分割任务。 特别鸣谢本次论文速览主要组织者: 月度轮值AC:王智慧 (大连理工大学)、杨旭 (西安电子科技大学) 季度责任AC:魏秀参 (南京理工大学) 活动参与方式 1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们! 直播地址: https://live.bilibili.com/22300737; 历史视频观看地址: https://space.bilibili.com/562085182/ 2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ R群,群号:137634472); *注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。 3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。 4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。 |
小黑屋|手机版|Archiver|Vision And Learning SEminar
GMT+8, 2025-1-9 23:39 , Processed in 0.014465 second(s), 14 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.