18-06期VALSE Webinar会后总结

程一-计算所 · 发表于 2018-4-16 16:11:56

卡内基梅陇大学博士生仉尚航2018年3月28日VALSE Webinar 成功举办。

仉尚航，卡内基梅陇大学博士五年级，从事计算机视觉和深度学习的研究。研究经历包括车辆检测与计数，显著物体分割，基于生成对抗网络的图像合成等。曾获得Adobe学术合作基金，蒋震海外留学奖学金。担任过PLOS ONE, CVPR, ICCV, ECML-PKDD, CIS-RAM等期刊会议审稿人。在加入CMU前，在北京大学获得硕士学位，师从高文教授和解晓东教授。曾在Adobe research实习。

仉尚航Webinar的题目为：基于多个城市监控摄像头的城市交通深度理解。

在报告中，仉尚航首先介绍了城市交通分析的重要性和面临的挑战。具体介绍了在多个低分辨率城市摄像头捕捉的视频中实时地提取车辆数目的研究。她首先提出FCN-rLSTM网络来联合估计车辆密度和车辆数目。该网络以残差学习的形式联结全卷积网络FCN和LSTM。这种设计结合了FCN学习空间像素级预测的优势和LSTM学习复杂时域动态特征的优势。为了使深度计数模型可以适应于不同的城市摄像头，进一步提出了多摄像头域适应的新的泛化上界，来解决多个源摄像头有标注数据，一个目标摄像头没有标注数据的域适应问题，通过理论分析得到一种有效的基于对抗网络的学习策略。仉尚航介绍了如何设计网络模型学习多相机域不变，同时对车辆计数拥有辨别能力的特征表达来解释这种理论结果。

问答部分：

问题1：初始化multi-domain classifier 的时候因为没有得到训练，其loss也很大，是不是这个loss是一个U形线？

回答：multi-domain classifier在开始时因为没有得到训练loss是会比较大，随着训练的进行，分类器分类能力增强，loss会下降，但是最终对抗训练会鼓励网络提取出域不变的特征，迷惑域分类器，loss是会增加的。

问题2：multi-domain classifier的目标是让source feature 和target feature 尽可能在一个空间，但是分类的loss会不会让他们的feature离得越远。感觉和刚开始的目标有点矛盾。

回答：因为我们采用的是对抗训练的形式，鼓励分类loss越来越大，从而鼓励网络提取出域不变的特征，因此和让source feature 和target feature 尽可能在一个空间的目标是一致的。故而不会矛盾。

问题3: 多个domain的multi-domain learning是不是不如一对一的训练方式好？

回答：从实验结果来看多个domain的multi-domain adversarial learning好于一对一的domain adaptation。通过multi-domain adversarial training 可以提取出更好的多域不变的特征，更有效的利用多个域的训练数据，从而在目标域上得到更准确的测试效果。

问题4：多任务训练是否借鉴GAN的方式？

回答：GAN的训练方法对我们的训练很有启发，我们也设置了不同的训练策略，会比GAN更好训练。

问题5：代码和数据会开源？

回答：IP审核过后会开源。

问题6：关于车辆计数您觉得后续还有什么点值得深挖？

回答：车辆计数还有很多点值得深挖。从理论角度，可以继续研究如何设计深度模型针对不同的摄像头进行很好的adaptation，从而使计数模型在不同摄像头，不同环境状态下都可以得到准确的计数效果；另外还可以研究如何结合地理信息来设计DNN，从而减少训练数据。从应用角度：可以研究如何设计面向大规模摄像头，比如几百个摄像头的车辆计数系统；也可以将该方法扩展到其它的应用，比如人群计数，细胞计数等。

录像视频在线观看地址： 本期视频暂不公开。

特别鸣谢本次Webinar主要组织者：

VOOC责任委员：杨恒（剑桥）

VODB协调理事：禹之鼎（NVIDIA Research）

活动参与方式：

1、VALSE Webinar活动依托在线直播平台进行，活动时讲者会上传PPT或共享屏幕，听众可以看到Slides，听到讲者的语音，并通过聊天功能与讲者交互；

2、为参加活动，请关注VALSE微信公众号：valse_wechat 或加入VALSE QQ群（目前A、B、C、D、E、F、G群已满，除讲者等嘉宾外，只能申请加入VALSE H群，群号：701662399），直播链接会在报告当天（每周三）在VALSE微信公众号和VALSE QQ群发布；

*注：申请加入VALSE QQ群时需验证姓名、单位和身份，缺一不可。入群后，请实名，姓名身份单位。身份：学校及科研单位人员T；企业研发I；博士D；硕士M。

3、在活动开始前10分钟左右，讲者会开启直播，听众点击直播链接即可参加活动，支持安装Windows系统的电脑、MAC电脑、手机等设备；

4、活动过程中，请勿送花、打赏等，也不要说无关话语，以免影响活动正常进行；

5、活动过程中，如出现听不到或看不到视频等问题，建议退出再重新进入，一般都能解决问题；

6、建议务必在速度较快的网络上参加活动，优先采用有线网络连接；

7、VALSE微信公众号会在每周一推送上一周Webinar报告的总结及视频（经讲者允许后），每周四发布下一周Webinar报告的通知。