为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自浙江大学、北京交通大学、百度研究院和悉尼科技大学的语义分割方面的工作。该工作由魏云超教授指导,论文第一作者苗嘉旭博士后录制。 论文题目:VSPW: A large-scale dataset for video scene parsing in the wild 作者列表:苗嘉旭 (浙江大学),魏云超 (北京交通大学),武宇 (百度研究院),梁琛 (浙江大学),李光睿 (悉尼科技大学),杨易 (浙江大学) B站观看网址: 论文摘要: 语义分割是计算机视觉领域的一个基本任务,在自动驾驶、图片或视频编辑等多个领域应用广泛。近年来,图像语义分割方法已经有了长足的发展。然而,在现实世界应用中,数据的形式一般是视频而不是静态图片。而目前对视频语义分割的探索仍然比较有限,一个重要原因是缺少足够规模的视频语义分割数据集。本文提出了首个多场景大规模视频语义分割数据集,VSPW。VSPW是第一个多场景大规模视频语义分割数据集,VSPW数据集有着以下特点:1. 大规模、多场景标注。本数据集共标注3,536个视频,251, 632帧语义分割图片,涵盖了124个语义类别,标注数量远超之前的视频语义分割数据集。与之前数据集仅关注街道场景不同,本数据集覆盖超过200种视频场景,极大丰富了数据集的多样性。2. 密集标注。之前数据集对视频数据标注很稀疏,比如CamVid按照1 f/s的帧率标注视频。VSPW数据集按照15f/s的帧率对视频片段标注,提供了更密集的标注数据。3. 高清视频标注。本数据集中,超过96%的视频数据分辨率在720P至4K之间。 论文信息: [1] Jiaxu Miao, Yunchao Wei, Yu Wu, Chen Liang, Guangrui Li, Yi Yang. VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021. 论文链接: [https://openaccess.thecvf.com/content/CVPR2021/papers/Miao_VSPW_A_Large-scale_Dataset_for_Video_Scene_Parsing_in_the_CVPR_2021_paper.pdf] 代码链接: [https://www.vspwdataset.com/] 视频讲者简介: 苗嘉旭,浙江大学博士后。在CVPR/ ICCV/ IEEE TNNLS等国际高水平会议或期刊发表多篇论文,博士期间主要研究方向是行人再识别和视频分割。 特别鸣谢本次论文速览主要组织者: 月度轮值AC:杨曦 (西安电子科技大学)、王鑫 (清华大学) 季度责任AC:杨猛 (中山大学) 活动参与方式 1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们! 直播地址: https://live.bilibili.com/22300737; 历史视频观看地址: https://space.bilibili.com/562085182/ 2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ R群,群号:137634472); *注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。 3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。 4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。 |
小黑屋|手机版|Archiver|Vision And Learning SEminar
GMT+8, 2025-1-16 02:36 , Processed in 0.012395 second(s), 14 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.