17-27期VALSE Webinar会后总结

程一-计算所 · 发表于 2017-11-30 16:10:14

马隆科技黄伟林老师2017年11月29日VALSE Webinar 成功举办。

黄伟林，马隆科技首席科学家，曾在英国牛津大学Andrew Zisserman的VGG组博士后。IEEE高级会员、ACM会员。

黄伟林老师Webinar的题目为：Learn CNNs from Large-scale Web Images without human annotation （从大规模网络图片中无需人类标签学习网络的方法探索）

在报告中，黄老师首先回顾了图像识别中提高准确率的基本方法构成。由此，介绍了不需要人类标注的大规模图像识别的问题设定以及其作为一个公司实际需求的背景。不需要人类标注的识别问题含有大量标识噪音，类别分布不均匀。黄老师系统介绍了从含噪音标签中学习模型的方法，然后介绍了黄老师所在马隆科技团队参加CVPR17 WebVision竞赛中取得冠军的方法。此方法引入课程学习（Curriculum Learning），将学习任务根据难度排序，在训练过程中进行任务转化，从容易任务到更难任务逐渐学习，提高模型泛化能力。通过聚类为每一个类别找到样本子集，样本子集噪声数目不一样。在训练中，先利用高置信度的的子集训练，最后将低置信度的子集引入。在此基础上，进一步引入类别平衡的方法处理类别中样本数目不平衡问题，提高模型准确率。在大规模数据集上，提出的新方法带来明显的准确率提升。

问答部分：

问1：subset2和subset3的为什么权重相同？

答：subset3的权重是不是要小一点按照常理。时间所限，未能详细调节。

问2：有没有相关文章？

答：会整理一下。通用到其他benchmark。

问3：训练样本数量平衡的问题是怎样缓解的？

答：按照比例分成三种不同的课程，把每个类的样本按照比例分，不同类别的训练样本仍然是不平衡的。并不与课程学习相关，专门用了方法来解决不平衡问题。与课程学习结合。

问4：curriculum learning 带来特征的提升主要在high-level feature上，还是low-level features，有没有相应的ablation study？

答：主要是high level。

问5：ppt可以分享吗,老师？

答：可以的，会通过Valse平台共享。

问6：哪些方面体现弱监督了？

答：将有噪音的标注认为是正确标注。然后通过聚类找出置信度高的子集，利用课程学习的方法更多依赖于置信度高的子集，从而提高模型的准确率。

问7：一个商品识别需要多少训练样本？

答：根据需求决定，并不一定。

录像视频在线观看地址： http://www.iqiyi.com/u/2289191062

活动参与方式：

1、VALSE Webinar活动全部网上依托VALSE QQ群的“群视频”功能在线进行，活动时讲者会上传PPT或共享屏幕，听众可以看到Slides，听到讲者的语音，并通过文字或语音与讲者交互；

2、为参加活动，需加入VALSE QQ群，目前A、B、C、D、E、F群已满，除讲者等嘉宾外，只能申请加入VALSE G群，群号：669280237。申请加入时需验证姓名、单位和身份，缺一不可。入群后，请实名，姓名身份单位。身份：学校及科研单位人员T；企业研发I；博士D；硕士M

3、为参加活动，请下载安装Windows QQ最新版，群视频不支持非Windows的系统，如Mac，Linux等，手机QQ可以听语音，但不能看视频slides；

4、在活动开始前10分钟左右，主持人会开启群视频，并发送邀请各群群友加入的链接，参加者直接点击进入即可；

5、活动过程中，请勿送花、棒棒糖等道具，也不要说无关话语，以免影响活动正常进行；

6、活动过程中，如出现听不到或看不到视频等问题，建议退出再重新进入，一般都能解决问题；

7、建议务必在速度较快的网络上参加活动，优先采用有线网络连接。