VALSE 论文速览第41期：去栅格化的矢量图识别

2022-1-18 14:39| 发布者: 程一-计算所| 查看: 1283| 评论: 0

摘要: 为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展，VALSE最新推出了《论文速览》栏目，将在每周发布一至两篇顶会顶刊论文的录制视频，对单个前沿工作进行细致讲解。本期VALSE论文速 ...

为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展，VALSE最新推出了《论文速览》栏目，将在每周发布一至两篇顶会顶刊论文的录制视频，对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自微软亚洲研究院矢量图识别方面的工作。工作视频由论文第一作者，微软亚洲研究院研究员蒋忻洋录制。

论文题目：去栅格化的矢量图识别

作者列表：蒋忻洋 (MSRA), 刘璐 (悉尼科技大学), 单才华 (MSRA), 沈逸飞 (香港科技大学), 董宣毅 (悉尼科技大学), 李东胜 (MSRA)

B站观看网址：

https://www.bilibili.com/video/BV113411e7ny/

论文摘要：

本文工作关注在一种与以往大多数工作不同的图像格式：矢量图。和在图像识别中常用的位图不同，由于矢量图基于解析几何的表示方式，可以被无损失的缩放到任意分辨率。同时，矢量图还提供了额外的结构化信息，描述了底层元素是如何构成高层的形状和结构。现有的识别方法并没有充分利用这一格式的优点。本文通过目标检测这一基本的视觉任务来探索这个图像格式。我们提出了一种无需CNN的高效网络结构，在识别过程中无需将矢量图渲染为像素图 (即栅格化)，直接把矢量图的文本作为模型输入，称为YOLaT (You Only Look at Text)。YOLaT将矢量图的结构和空间信息建模为一个多重图，并提出一个双流图神经网络基于多重图来进行目标检测。实验证明YOLaT通过直接对矢量图进行处理分析，能够在计算效率和性能上显著超过现有的目标检测方法。

论文信息：

[1]Xinyang Jiang, Lu Liu, et al. "Recognizing Vector Graphics without Rasterization." Proceedings of Advances in Neural Information Processing Systems. 2021.

论文链接：

[https://papers.nips.cc/paper/2021/file/cdf1035c34ec380218a8cc9a43d438f9-Paper.pdf]

视频讲者简介：

蒋忻洋，来自微软亚洲研究院 (MSRA)计算视觉组高级研究员。博士毕业于浙江大学，2020年加入MSRA。研究方向为，计算机视觉，行人重识别。

特别鸣谢本次论文速览主要组织者：

月度轮值AC：董宣毅 (Amazon)、谢凌曦 (华为数字技术有限公司)

季度责任AC：许永超 (武汉大学)

活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行，欢迎在B站搜索VALSE_Webinar关注我们！

直播地址：

https://live.bilibili.com/22300737；

历史视频观看地址：