为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周二和周五各发布一篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自浙江大学、微软亚洲研究院合作完成的图像翻译方面的工作。工作由浙江大学博士生周星然在微软实习期间完成,视频由微软亚洲研究院研究员张博录制完成。 论文题目:CoCosNet v2:基于样例图像的高清图像翻译网络 作者列表:周星然 (浙江大学, MSRA实习生), 张博 (MSRA), 张婷 (MSRA), 张攀 (中科大, MSRA联合培养博士), 鲍建敏 (MSRA), 陈栋 (MSRA), 张仲飞 (浙江大学), 闻芳 (MSRA) B站观看网址: 复制链接到浏览器打开或点击阅读原文即可跳转至观看页面。 论文摘要: 在我们先前提出的CoCosNet工作中,算法按照用户给定样例生成多模态结果, 解决了图像生成过程中风格精细控制的难题,在一系列图片翻译任务中取得大幅领先的生成质量。遗憾的是由于较大的计算内存开销,这个方法并不能很好的拓展到高清图生成。我们近期提出CoCosNet v2, 借鉴了PatchMatch的思想,充分利用了自然图片特征空间局部连续的特点,用迭代的方法来换取内存开销,实现了在原高清分辨率下高效近似注意力(attention)机制。实验表明,CoCosNet v2 在多个数据集可以取得大幅领先的视觉效果,且高清图的过程中风格精确可控。 论文信息: [1] Zhou, Xingran, et al. "CoCosNet v2: Full-Resolution Correspondence Learning for Image Translation." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021. 论文链接: [https://arxiv.org/abs/2012.02047] 论文代码: [https://github.com/microsoft/CoCosNet-v2] 视频讲者简介: 张博,微软亚洲研究院(MSRA)计算视觉组研究员。博士毕业于香港科技大学,2019年加入MSRA。研究方向为,计算机视觉,生成模型与计算成像。 个人主页: https://bo-zhang.me 特别鸣谢本次论文速览主要组织者: 月度轮值AC:王栋 (大连理工大学)、王鹤 (北京大学) 季度责任AC:王兴刚 (华中科技大学) 活动参与方式 1、VALSE每周举行的Webinar活动依托B站直播平台进行,直播地址:https://live.bilibili.com/22300737;VALSE的近期历史视频可在这里观看:https://space.bilibili.com/562085182/ 2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ Q群,群号:698303207); *注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。 3. VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。 4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。 |
小黑屋|手机版|Archiver|Vision And Learning SEminar
GMT+8, 2025-1-11 15:11 , Processed in 0.013890 second(s), 14 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.