报告嘉宾:阚美娜 (中科院计算所) 报告题目:多粒度图像迁移建模 报告嘉宾:宫博庆 (Google Research) 报告题目:Towards Visual Recognition in the Wild: Long-Tailed Sources and Open Compound Targets Panel嘉宾: 阚美娜 (中科院计算所)、宫博庆 (Google Research)、杜博 (武汉大学)、段立新 (电子科技大学)、张磊 (重庆大学) Panel议题: 1. 迁移学习技术在实际工程应用中的价值是什么?有哪些已知的和潜在的应用场景? 2. 迁移学习的局限有哪些,有哪些情况或者任务不适合迁移学习? 3. 实际应用中,迁移并不总是有效。如何自动判别可迁移性?如何避免负迁移? 4. 当前迁移学习的主要benchmark有哪些缺陷?需要建设什么样的benchmark才能真正驱动该领域的健康发展? 5. 迁移学习与生成对抗网络的联系?和相关的外延方向的区别与联系是什么,比如零样本学习、小样本学习、元学习? 6. 迁移学习有哪些新的、有意思的研究方向?下一步的发展方向在哪里? *欢迎大家在下方留言提出主题相关问题,主持人和panel嘉宾会从中选择若干热度高的问题加入panel议题! 报告嘉宾:阚美娜 (中科院计算所) 报告时间:2020年7月22日 (星期三)晚上21:00 (北京时间) 报告题目:多粒度图像迁移建模 报告人简介: 阚美娜,中科院计算所 副研究员。研究领域为计算机视觉与模式识别,主要关注人脸识别、多视学习、迁移学习、弱少监督学习等问题,相关成果已发表在TPAMI、IJCV、CVPR、ICCV等相关领域主流国际期刊与会议上面,谷歌学术引用2300余次。担任TPAMI、IJCV、TIP、TMM、CVPR、ICCV、ECCV等期刊会议的审稿人。2014年获得CCF优秀博士学位论文奖、2016年入选CCF青年人才托举计划、2018年获得中国图象图形学学会石青云女科学家奖青年奖、2019年入选北京市科技新星计划。此外,获得2015年IEEE FG视频人脸识别竞赛冠军、2015年IEEE ICCV年龄估计竞赛亚军、2017年IEEE CVPR人脸面部关键点定位亚军等。 个人主页: http://vipl.ict.ac.cn/people/~mnkan 报告摘要: 迁移学习是机器学习与计算机视觉中的重要研究问题之一,旨在研究如何将一个领域的知识迁移到另外的领域,具有重要的研究意义与应用价值。本报告将介绍讲者近期在图像域、类别、以及样例层面进行迁移建模的研究工作,主要面向图像分类以及属性风格迁移任务。 参考文献: [1] Lanqing Hu, Meina Kan, Shiguang Shan, Xilin Chen. Duplex Generative Adversarial Network for Unsupervised Domain Adaptation. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018. [2] Lanqing Hu, Meina Kan, Shiguang Shan, Xilin Chen. Unsupervised Domain Adaptation With Hierarchical Gradient Synchronization. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020. [3] Nan Lai, Meina Kan, Chunrui Han, Xingguang Song, and Shiguang Shan. Learning to Learn Adaptive Classifier-Predictor for Few Shot Learning. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2020. 报告嘉宾:宫博庆 (Google Research) 报告时间:2020年7月22日 (星期三)晚上21:30 (北京时间) 报告题目:Towards Visual Recognition in the Wild: Long-Tailed Sources and Open Compound Targets 报告人简介: Boqing Gong is a research scientist at Google, Seattle and a principal investigator at ICSI, Berkeley. His research in machine learning and computer vision focuses on data-efficient learning (e.g., domain adaptation, few-shot, reinforcement, webly-supervised, and self-supervised learning) and the visual analytics of objects, scenes, human activities, and their attributes. Before joining Google in 2019, he worked in Tencent and was a tenure-track Assistant Professor at the University of Central Florida (UCF). He received an NSF CRII award in 2016 and an NSF BIGDATA award in 2017, both of which were the first of their kinds ever granted to UCF. He is/was a (senior) area chair of NeurIPS, ICML, CVPR, ICCV, ECCV, AAAI, AISTATS, and WACV. He earned a Ph.D. degree in 2015 at the University of Southern California, where the Viterbi Fellowship partially supported his work. 个人主页: http://boqinggong.info/ 报告摘要: Recent work shows that coupling deep learning models with big, manually compiled datasets can yield unprecedented results for recognizing objects, scenes, human activities, and attributes to name a few. However, as we continue to push the boundary of recognition performance, and as the number of classes scales up, long tails emerge as the elephant in the room since object frequency often follows a power law in the real world. That is the challenge during training. During testing, model robustness becomes crucial because the wild data is often out of the distribution of training data (e.g., adversarial examples, data of new domains, etc.). In this talk, I will present our recent work on long-tailed visual recognition and open compound domain adaptation. The former aims to learn high-quality, unbiased deep classifiers from the training sets of long-tailed distributions over classes, and the latter improves the models' robustness in handling out-of-domain data in the wild. We develop novel methods by drawing inspiration from meta-learning, memory networks, adversarial training, and curriculum learning. 参考文献: [1] Z Liu*, Z Miao*, X Zhan, J Wang, B Gong, and S Yu. Large-Scale Long-Tailed Recognition in an Open World. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019 (Oral) [2] M Jamal, M Brown, L Wang, M Yang, and B Gong. Rethinking Class-Balanced Methods for Long-Tailed Visual Recognition from a Domain Adaptation Perspective. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020 (Oral) [3] X Yue, Y Zhang, S Zhao, A Sangiovanni-Vincentelli, K Keutzer, and B Gong. Domain Randomization and Pyramid Consistency: Simulation-to-Real Generalization without Accessing Target Domain Data. International Conference on Computer Vision (ICCV), 2019 [4] Z Liu*, Z Miao*, X Pan, X Zhan, D Lin, S Yu, and B Gong. Open Compound Domain Adaptation. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020 (Oral) Panel嘉宾:杜博 (武汉大学) 嘉宾简介: 杜博,武汉大学教授,国家自然科学基金优秀青年科学基金获得者,湖北省杰青,武汉大学“珞珈特聘教授”,博士生导师,计算机学院副院长,国家多媒体软件工程技术研究中心主任,人工智能研究院常务副院长,IEEE Senior Member,人工智能领域学术期刊Neural Networks、Pattern Recognition等的Associate Editor,人工智能领域CCF A类顶会AAAI、IJCAI、KDD的Senior PC Member/PC Member,图像处理领域著名会议ICPR和IJCNN的Area chair。主要从事人工智能、计算机视觉和图像处理等方面的研究工作,近五年主持和参与相关纵向研究课题30余项。获得2019湖北省自然科学一等奖(排名第1);2019 科睿唯安全球高引学者;人工智能顶会IJCAI 2018 杰出论文奖;高维图像信号处理顶会IEEE WHISPERS 2018最佳论文奖;2018 IEEE 全球数据融合大赛冠军。 个人主页: http://sigma.whu.edu.cn/ Panel嘉宾:段立新 (电子科技大学) 嘉宾简介: 段立新,电子科技大学教授、博士生导师,VALSE EAC。2008年中国科学技术大学学士,2012年新加坡南洋理工大学博士。主要研究方向为迁移学习、深度学习等机器学习算法研究,及其在物体识别/检测/分割、视频事件识别等计算机视觉应用。近年来在国际高水平会议和期刊发表论文40余篇,Google Scholar总引用3500余次。曾获2009年微软亚洲研究院微软学者奖,2010年CVPR最佳学生论文奖。 个人主页: http://www.lxduan.info/ Panel嘉宾:张磊 (重庆大学) 嘉宾简介: 张磊,重庆大学微电子与通信工程学院教授,博导,重庆市生物感知与智能信息处理重点实验室副主任,IEEE Senior Member。主要研究迁移自适应学习和开放环境的计算机视觉。以第一或通讯在IEEE Transactions (TPAMI/ TIP/ TCSVT/ TNNLS/ TMM等)以及CVPR/ ICCV/ ECCV/ AAAI/ IJCAI/ ACM MM等发表论文90余篇,出版学术专著1部,被引用千余次。现担任IEEE Trans. Instrumentation and Measurement和Neural Networks期刊的Associate Editor,曾担任ACM MM/ CVPR/ AAAI/ ICLR/ IJCAI/ ACCV/ WACV/ BMVC/ ICME等会议领域主席和程序委员等,获得2019 ACM SIGAI中国新星奖。以第1完成人分别获得吴文俊人工智能自然科学二等奖和重庆市自然科学二等奖共2项。 个人主页: https://www.leizhang.tk 主持人:李文 (电子科技大学) 主持人简介: 李文,电子科技大学教授,博士生导师,2015年获新加坡南洋理工大学博士,2015年至2019年在瑞士苏黎世联邦理工学院计算机视觉实验室从事研究工作。主要研究领域为计算机视觉与机器学习,专注于计算机视觉任务中的领域适应、迁移学习、弱监督学习、半监督学习等关键问题,在T-PAMI、IJCV、CVPR、ICCV、ECCV等在内的领域重要国际期刊和国际会议论文40余篇,Google Scholar的总引用次数2700余次。是迁移学习领域重要研讨会ICCV/ECCV Workshops on TASK-CV的主办者之一,以及互联网数据学习研讨会CVPR Workshops on WebVision的发起人之一。 个人主页: https://wenli-vision.github.io/ 20-19期VALSE在线学术报告参与方式: 长按或扫描下方二维码,关注“VALSE”微信公众号 (valse_wechat),后台回复“19期”,获取直播地址。 特别鸣谢本次Webinar主要组织者: 主办AC:李文 (电子科技大学) 协办AC:杜博 (武汉大学)、段立新 (电子科技大学)、张磊 (重庆大学) 责任AC:韩琥 (中科院计算所) 活动参与方式 1、VALSE Webinar活动依托在线直播平台进行,活动时讲者会上传PPT或共享屏幕,听众可以看到Slides,听到讲者的语音,并通过聊天功能与讲者交互; 2、为参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ群(目前A、B、C、D、E、F、G、H、I、J、K、L、M群已满,除讲者等嘉宾外,只能申请加入VALSE N群,群号:942264004); *注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。 3、在活动开始前5分钟左右,讲者会开启直播,听众点击直播链接即可参加活动,支持安装Windows系统的电脑、MAC电脑、手机等设备; 4、活动过程中,请不要说无关话语,以免影响活动正常进行; 5、活动过程中,如出现听不到或看不到视频等问题,建议退出再重新进入,一般都能解决问题; 6、建议务必在速度较快的网络上参加活动,优先采用有线网络连接; 7、VALSE微信公众号会在每周四发布下一周Webinar报告的通知及直播链接。 8、Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新[slides]。 9、Webinar报告的视频(经讲者允许后),会更新在VALSE爱奇艺、B站、西瓜视频,请在搜索Valse Webinar进行观看。
阚美娜 [slides] 宫博庆 [slides] |
小黑屋|手机版|Archiver|Vision And Learning SEminar
GMT+8, 2024-12-23 17:26 , Processed in 0.015016 second(s), 14 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.