17-20期VALSE Webinar会后总结

程一-计算所 · 发表于 2017-9-11 15:35:05

西北工业大学张鼎文2017年9月6日VALSE Webinar 成功举办。

张鼎文，西北工业大学博士研究生，卡耐基梅隆大学访问学生。2012年获得西北工业大学学士学位，后相继保送为自动化学院模式识别与智能系统硕士、博士研究生，研究方向为计算机视觉与机器学习，导师为韩军伟教授。自2015年10月起，获得国家留学基金委资助，在卡耐基梅隆大学进行为期2年的访问研究。先后在包括IEEE T-PAMI、IJCV、CVPR、ICCV等本领域知名国际期刊与会议上发表学术论文20余篇。

张鼎文Webinar的题目为：Weakly Supervised Visual learning.

在报告中，张鼎文同学首先简单介绍了弱监督视觉学习的基本概念与本质目标，回顾了近10年来弱监督视觉学习领域的发展进程。然后结合其在CVPR2017上发表的两个工作分别介绍了他们在弱监督视频目标分割与弱监督三维重构任务中的最新研究进展。他们所提出的方法利用自步学习和课程学习构建弱监督下的稳健学习机制，并结合多重弱监督学习任务使其相互促进与协作。这些方法可以极大程度上减弱弱监督视觉学习中的学习不确定性问题。报告的最后还点明了弱监督视觉学习的一些应用方向和未来研究方向。

问答部分：

问题1：请问弱监督对数据集和要解决的问题有何要求，包括数量和label的程度

回答：通常情况下对数量没有明确要求，主要是对label的程度有要求。对视觉领域来说，这里的label通常是image-level tag而不能使更精细的pixel或者bounding box-level label。

问题2：你好，请问自步（self-paced）学习和自监督学习有什么区别?

回答：自监督学习是一种学习形式，自步学习是一种学习机制。自步学习可以用于自监督学习也可以用于监督学习等其他的学习形式。

问题3：非常好的讲座，感谢张博士！我是初学者，请问是否需要熟练掌握监督学习，才能进入弱监督学习的研究？

回答：需要掌握弱监督学习的主要思想，以及你自己所要解决问题的本质。不需要对所有弱监督学习算法都熟练掌握，因为往往面向不同问题的弱监督学习算法具有不同的侧重与考虑。

问题4：请问弱标记的label信息是如何使用的？是在构建伪标记的时候利用的吗？

回答：有多种使用方式，在我们的工作中就是利用伪标签将具有相同semantic的视频或者图像放在一起学习。其他的方法也有直接把这些伪标记当作最后的学习目标的。这与所设计的弱监督学习框架有关。

问题5：感谢张博士内容充实的报告。PPT的内容很多，讲的时候，设计目标函数及优化过程（算法）都是一笔带过了。请问，弱监督学习的优化算法能多介绍些么？有哪些开源工具可以使用，谢谢！

回答：由于算法一般会涉及很多公式推导，在talk里面不太好讲清楚，建议读者自己查看相关论文，弱监督学习有一些开源工具，但不是很多，例如弱监督目标检测的牛津的WSDDN 算法，或者早起用的基于MIL的一些算法。

问题6：物体三维结构的Ground Truth从哪里获得？重建的精度如何确定？

回答：Ground truth是数据库提供的，重构精度是用常规的评价准则计算的，可以查阅我们的论文。

问题7：物体三维结构的Ground Truth从哪里获得？重建的精度如何确定？

回答：Ground truth是数据库提供的，重构精度是用常规的评价准则计算的，可以查阅我们的论文。

问题8：半监督和弱监督如何明确区分的

回答：例如有100个训练样本，半监督是完全标注10个样本，剩下90个完全不标注。弱监督学习是对着100个样本进行弱标注。

问题9：弱监督学习可以用于目标分割，与正常的图像目标分割有什么区别吗？优势在什么地方呢？

回答：目的是一样的，优势在于在进行学习的阶段对人们标注的信息的依赖减少很多，有利于训练的规模化。

问题10：如果是相对模糊的图像话，自步的弱监督学习对这样的数据集效果如何提升

回答：这与你利用模糊图像做什么任务有关。

问题11：我们磁环表面有裂伤，不定位置和形态张老师能用这种弱监督学习去自动分拣出表面有裂伤的磁环图像吗吗？

回答：可以，但是感觉这个问题可能用传统的监督学习更好，因为他不存在规模化的问题，这样的数据看上去并不很容易规模化。

问题12：请问现在深度学习适用于视频显著性物体检测吗？现在感觉怎么用深度学习解决视频显著性检测的工作不太多呢？

回答：适用，但是大家目前更关注图像显著性检测，因为图像解决的差不多了，视频的问题也就迎刃而解了，现在可能在视频上利用深度学习的框架变化的可能性不是太大，大部分idea都有人探讨过了。

问题13：张博士的演讲很精彩，能简略分享下，您在博士期间能取得这么多成果，是怎么做到的？谢谢！

回答：多动脑，多动手，足够努力。

录像视频在线观看地址： http://www.iqiyi.com/u/2289191062

活动参与方式：

1、VALSE Webinar活动全部网上依托VALSE QQ群的“群视频”功能在线进行，活动时讲者会上传PPT或共享屏幕，听众可以看到Slides，听到讲者的语音，并通过文字或语音与讲者交互；

2、为参加活动，需加入VALSE QQ群，目前A、B、C、D、E群已满，除讲者等嘉宾外，只能申请加入VALSE F群，群号：594312623 。申请加入时需验证姓名、单位和身份，缺一不可。入群后，请实名，姓名身份单位。身份：学校及科研单位人员T；企业研发I；博士D；硕士M

3、为参加活动，请下载安装Windows QQ最新版，群视频不支持非Windows的系统，如Mac，Linux等，手机QQ可以听语音，但不能看视频slides；

4、在活动开始前10分钟左右，主持人会开启群视频，并发送邀请各群群友加入的链接，参加者直接点击进入即可；

5、活动过程中，请勿送花、棒棒糖等道具，也不要说无关话语，以免影响活动正常进行；

6、活动过程中，如出现听不到或看不到视频等问题，建议退出再重新进入，一般都能解决问题；

7、建议务必在速度较快的网络上参加活动，优先采用有线网络连接。

17-20期VALSE Webinar会后总结

浏览过的版块