20210331-08 总第234期物体检测与视觉定位

2021-3-26 16:30| 发布者: 程一-计算所| 查看: 3141| 评论: 0

摘要: 报告时间2021年03月31日 (星期三)晚上20:00 (北京时间)主题物体检测与视觉定位主持人杨猛 (中山大学)张姗姗 (南京理工大学)报告嘉宾：程明明 (南开大学)报告题目：大规模图像的多粒度目标检测报告嘉宾：李文 (电子 ...

报告时间	2021年03月31日 (星期三) 晚上20:00 (北京时间)
主题	物体检测与视觉定位
主持人	杨猛 (中山大学) 张姗姗 (南京理工大学)

报告嘉宾：程明明 (南开大学)

报告题目：大规模图像的多粒度目标检测

报告嘉宾：李文 (电子科技大学)

报告题目：领域自适应的目标检测

Panel嘉宾：

程明明 (南开大学)、李文 (电子科技大学)、雷震 (中国科学院自动化研究所)、张姗姗 (南京理工大学)、杨猛 (中山大学)

Panel议题：

1. 图像中的多粒度信息获取与分析还有哪些值得深入研究的问题？

2. 目标检测与定位未来怎么样能够摆脱对大规模标注数据的依赖?

3. 在深度学习的浪潮下，通用物体检测得到迅猛发展，而一些特定类别的检测，如人脸检测、行人检测等，依然是活跃的研究领域，这些领域有哪些特殊的挑战值得关注？

4. 在实际场景中，数据通常呈现长尾分布，然而目前在物体检测领域针对长尾分布的研究工作还不多，这是不是一个值得关注的研究方向？

5. 目标检测与定位利用大规模数据无监督学习有什么研究的问题和方向？

6. 如何比较有效地解决目标检测与定位中的物体共现、遮挡等干扰?

*欢迎大家在下方留言提出主题相关问题，主持人和panel嘉宾会从中选择若干热度高的问题加入panel议题！

报告嘉宾：程明明 (南开大学)

报告时间：2021年3月31日 (星期三)晚上20:00 (北京时间)

报告题目：大规模图像的多粒度目标检测

报告人简介：

程明明，南开大学教授，计算机系主任，国家“万人计划”青拔、“优青”。他的主要研究方向是计算机视觉和计算机图形学，在SCI一区/CCF A类国际期刊和会议上发表学术论文100余篇，论文Google学术引用2万余次，一作论文单篇最高引用3800余次，连续4年入选Elsevier中国高被引学者榜单。技术成果被应用于华为手机智能拍照、推想科技CT影像智能分析、金风科技风电设备运行监控、和中化农业病虫害识别等领域。获得ACM中国新星奖、天津市青年科技奖、吴文俊人工智能自然科学二等奖、中国图象图形学学会自然科学一等奖、教育部自然科学一等奖等奖项。现为中国图象图形学学会副秘书长，并担任SCI一区期刊IEEE TIP编委。

个人主页：

https://mmcheng.net

报告摘要：

从图像中快速准确地获取目标信息是计算机视觉的核心任务。鲁棒的目标检测与信息提取需要对不同粒度的信息进行高效的整合。本报告从多层次卷积特征融合、基于短连接的多尺度融合与深度监督、基于分层递进残差设计的层内多尺度特征表达、时序多层次信息提取、霍夫空间度尺度检测、多模型高效融合、多图像联系分析等角度入手，系统地介绍南开大学媒体计算团队在边缘检测、显著性物体检测、图像分类、语义分割、物体检测、关键点估计、视频动作分割，语义线检测、行人计数、年龄估计、图像超分辨率等领域的最新研究进展。同时，本次报告也将从实例、图像、以及整个数据集三个粒度出发，对大规模图像集合进行联合分析，以减少图像理解算法对大规模精确标注的依赖。

参考文献：

[1] Richer Convolutional Features for Edge Detection, IEEE TPAMI 2019.

[2] Deeply supervised salient object detection with short connections, IEEE TPAMI 2019.

[3] Revisiting Video Saliency Prediction in the Deep Learning Era , IEEE TPAMI 2020.

[4] Res2Net: A New Multi-scale Backbone Architecture, IEEE TPAMI 2020.

[5] MS-TCN++: Multi-Stage Temporal Convolutional Network for Action Segmentation, IEEE TPAMI 2020.

[6] Ordered or Orderless: A Revisit for Video based Person Re-Identification, IEEE TPAMI, 2020.

[7] Deep Hough Transform for Semantic Line Detection, IEEE TPAMI (minor).

[8] Nonlinear Regression via Deep Negative Correlation Learning, IEEE TPAMI 2020.

[9] Re-thinking Co-Salient Object Detection, IEEE TPAMI, 2021.

[10] Leveraging Instance-, Image- and Dataset-Level Information for Weakly Supervised Instance Segmentation, IEEE TPAMI 2020.

报告嘉宾：李文 (电子科技大学）

报告时间：2021年3月31日 (星期三)晚上20:30 (北京时间)

报告题目：领域自适应的目标检测

报告人简介：

李文，电子科技大学教授，博士生导师，四川省千人特聘专家，2015年获新加坡南洋理工大学博士，2015年至2019年在瑞士苏黎世联邦理工学院计算机视觉实验室从事研究工作。主要研究领域为计算机视觉与机器学习，专注于计算机视觉任务中的领域适应、迁移学习、弱监督学习、半监督学习等关键问题，在T-PAMI、IJCV、CVPR、ICCV、ECCV等在内的领域重要国际期刊和国际会议论文40余篇，Google Scholar的总引用次数3600余次。是迁移学习领域重要研讨会ICCV/ECCV Workshops on TASK-CV的主办者之一，以及互联网数据学习研讨会CVPR Workshops on WebVision的发起人之一。

长期担任包括T-PAMI、T-IP、T-NNLS、CVPR、ICCV、ECCV、NeurIPS、ICML、ICLR在内的重要国际期刊和会议审稿人，担任AAAI 2021领域主席、ACM MM 2021注册主席，获ECCV 2016、CVPR 2019杰出审稿人奖，与苏黎世联邦理工学院、南洋理工大学、悉尼大学、谷歌等一流科研机构和企业长期保持紧密的合作关系。

个人主页：

https://wenli-vision.github.io/

报告摘要：

训练数据和测试数据的独立同分布是主流机器学习的一个基本假设，但许多现实场景的应用中这个假设并不满足，导致训练的机器学习模型在实际场景中性能不佳。在本报告中，我将与大家分享我们在跨场景的目标检测方向上的研究进展和思路。具体地，面向自动驾驶的视觉感知任务，我们提出了融合几何先验的领域自适应目标检测模型，在领域自适应的目标检测模型中考虑行车场景中物体的远近大小等属性差异，在基于2D图像和3D点云的目标检测任务中取得了不错的效果。

参考文献：

[1] Y.Chen et al. Scale-aware Domain Adaptive Faster R-CNN. IJCV, 2021.

[2] W. Zhang et al. SRDAN: Scale-aware and Range-aware Domain Adaptation Network for Cross-dataset 3D Object Detection. CVPR, 2021.

[3] J. Deng et al. Unbiased Mean Teacher for Cross Domain Object Detection. CVPR 2021.

[4] M. Fu et al. Deeply Aligned Adaptation for Cross-domain Object Detection. arXiv:2004.02093, 2020.

Panel嘉宾：雷震 (中国科学院自动化研究所)

嘉宾简介：

雷震，男，博士，中国科学院自动化研究所研究员，中国科学院大学人工智能学院岗位教授，博士生导师。IEEE Senior Member，中国计算机学会（CCF）高级会员，中国图象图形学会视频监控与安全专委会副秘书长，中国计算机学会计算机视觉专委会委员，全国安防标委会人体生物特征识别应用技术委员会委员。其主要研究方向为生物特征识别（人脸识别），目标检测与识别等领域，发表论文160余篇，包括IEEE TPAMI，IEEE TIP，CVPR/ICCV/ECCV等。Google Scholar文章引用次数超15400 次，H-index：61，授权发明专利19项，制定发布国家公共安全行业标准7项。获2019年国际模式识别协会（IAPR）青年学者奖，指导学生6次获得国际会议最佳学生论文/提名，7次获得国际竞赛第一名。

个人主页：

www.cbsr.ia.ac.cn/users/zlei

Panel嘉宾/Panel主持人：张姗姗 (南京理工大学)

主持人简介：

张姗姗，南京理工大学计算机学院教授，博士生导师，“社会安全图像与视频理解” 江苏省重点实验室副主任。研究方向为计算机视觉，特别关注视频中人体检测与分析。曾于2015年2月在德国波恩大学获得计算机博士学位，博士论文获大德语区（德瑞奥三国）计算机学会最佳博士论文提名；博士毕业后在德国马普计算机研究所从事为期两年的博士后研究。2018年入选中国科协“青年人才托举工程”、微软“铸星学者”计划等。目前以第一/通讯作者身份在CVPR、ECCV、T-PAMI、IJCV等顶级国际会议和国际期刊上发表论文四十余篇，谷歌学术引用2100余次。担任模式识别权威期刊Pattern Recognition编委、中国人工智能学会模式识别专委会副秘书长、VALSE资深领域主席。

个人主页：

https://sites.google.com/site/shanshanzhangshomepage/

Panel嘉宾/主持人：杨猛 (中山大学)

主持人简介：

杨猛，中山大学副教授、博士生导师，IEEE Senior Member，中国计算机学会（CCF）高级会员。主要研究领域包括计算机视觉、自然语言处理与机器学习。迄今为止累计发表论文90余篇，其中包括IJCV, TIP, TNNLS, TIFS，PR等期刊和CVPR, ICCV, ICML, ECCV, AAAI, IJCAI, EMNLP Findings等会议论文。Google Scholar引用次数8000以上。相关成果已获得2017年教育部高校科研优秀成果奖自然科学奖一等奖1项（排名第二）。

个人主页：

www.smartllv.com

21-08期VALSE在线学术报告参与方式：

长按或扫描下方二维码，关注“VALSE”微信公众号 (valse_wechat)，后台回复“08期”，获取直播地址。