VALSE 论文速览第146期：SeqTrack: 基于序列生成的视觉目标跟踪算法 ...

2023-11-2 14:42| 发布者: 程一-计算所| 查看: 1316| 评论: 0

摘要: 为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展，VALSE最新推出了《论文速览》栏目，将在每周发布一至两篇顶会顶刊论文的录制视频，对单个前沿工作进行细致讲解。本期VALSE论文速 ...

为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展，VALSE最新推出了《论文速览》栏目，将在每周发布一至两篇顶会顶刊论文的录制视频，对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自大连理工大学和微软亚洲研究院的基于序列生成的视觉目标跟踪算法 (SeqTrack: Sequence to Sequence Learning for Visual Object Tracking)的工作。该工作是由王栋教授，卢湖川教授， 彭厚文研究员和胡涵研究员共同指导，论文一作陈鑫同学录制。

论文题目：

SeqTrack: Sequence to Sequence Learning for Visual Object Tracking

作者列表：

陈鑫 (大连理工大学)、彭厚文 (微软亚洲研究院)，王栋 (大连理工大学)，卢湖川 (大连理工大学)，胡涵 (微软亚洲研究院)

B站观看网址：

https://www.bilibili.com/video/BV1Nu4y1774e/

论文摘要：

目前的目标跟踪框架，一般采用“分而治之”的思想来建模跟踪任务，也就是把目标跟踪拆分为分类、回归、角点预测等多个子任务来分别解决。尽管这些方法很有效，但它们引入了多个定制化的预测头以及冗余的损失函数，使模型和训练流程变得复杂。直觉上，如果跟踪模型知道目标在哪，那么我们只需要教模型简单地读出目标的位置，而不需要显式地进行分类、回归。在本次分享中，将介绍我们在解决这个问题上的探索工作SeqTrack: Sequence to Sequence Learning for Visual Object Tracking (CVPR 2023)。我们通过将跟踪任务建模为单纯的序列生成任务，用Seq2seq的Transformer模型来完成视觉目标跟踪。实验表明，这种新的跟踪框架不仅摆脱了冗余的预测头和损失函数，也在多个数据集上取得了优秀的性能。

论文信息：

[1] SeqTrack: Sequence to Sequence Learning for Visual Object Tracking[C]. Chen X, Peng H, Wang D, et al. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023.

视频讲者简介：

陈鑫，大连理工大学信通学院IIAU-LAB博士研究生，指导教师为王栋教授、卢湖川教授，主要研究方向为计算机视觉，包括视觉目标跟踪、视频目标分割等。

个人主页:

https://scholar.google.com/citations?user=A04HWTIAAAAJ&hl=en

特别鸣谢本次论文速览主要组织者：

月度轮值AC：郭青 (新加坡科技研究局)

季度轮值AC：张磊 (重庆大学)

活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行，欢迎在B站搜索VALSE_Webinar关注我们！

直播地址：

https://live.bilibili.com/22300737；

历史视频观看地址：

https://space.bilibili.com/562085182/

2、VALSE Webinar活动通常每周三晚上20:00进行，但偶尔会因为讲者时区问题略有调整，为方便您参加活动，请关注VALSE微信公众号：valse_wechat 或加入VALSE QQ S群，群号：317920537）；

*注：申请加入VALSE QQ群时需验证姓名、单位和身份，缺一不可。入群后，请实名，姓名身份单位。身份：学校及科研单位人员T；企业研发I；博士D；硕士M。

3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。

4、您也可以通过访问VALSE主页：http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT（经讲者允许后），会在VALSE官网每期报告通知的最下方更新。

收藏邀请

上一篇：VALSE 论文速览第145期：ConZIC: Controllable Zero-shot Image Captioning下一篇：VALSE 论文速览第147期：SOLIDER：基于语义控制的人体视觉自监督预训练大模型 ...

下级分类

小黑屋|手机版|Archiver|Vision And Learning SEminar

GMT+8, 2025-7-31 09:30 , Processed in 0.013830 second(s), 14 queries .

返回顶部

VALSE 论文速览 第146期：SeqTrack: 基于序列生成的视觉目标跟踪算法 ...

相关分类

下级分类

VALSE 论文速览第146期：SeqTrack: 基于序列生成的视觉目标跟踪算法 ...