VALSE 2016 SPECIAL GUESTS

SPECIAL GUESTS

Tutorial Guests 按出场时间顺序

张敏灵

东南大学

王兴刚

华中科技大学

山世光

中科院计算所

梁小丹

Sun Yat-sen University

刘昕

中科院计算所

石葆光

华中科技大学

Special Guests 按姓氏拼音排列

陈云霁

中科院计算所

冯佳时

新加坡国立大学

胡晓林

清华大学

刘越

北京理工大学

沈春华

University of Adelaide

谭平

SFU

王井东

微软亚洲研究院

徐东

悉尼大学

薛建儒

西安交通大学

钟燕飞

武汉大学

Tutorial 嘉宾介绍

张敏灵

东南大学

多示例学习简介及其在计算机视觉中的应用

摘要:多示例学习(multi-instance learning, MIL)起源于T. G. Dietterich教授(AAAI现任主席)等人早期在药物活性预测方面的研究,经过近二十年的发展,现已成为机器学习领域的一类重要学习框架。本次报告将简要介绍多示例学习的基本概念与经典算法,讨论多示例学习相关研究问题,并给出多示例学习在计算机视觉中的应用现状。

嘉宾信息:张敏灵,东南大学计算机科学与工程学院教授。分别于2001年、2004年和2007年于南京大学计算机科学与技术系获学士、硕士和博士学位。主要研究领域为机器学习、数据挖掘。现任中国人工智能学会机器学习专委会秘书长、中国计算机学会人工智能与模式识别专委会委员等。担任《Frontiers of Computer Science》编委,《Machine Learning》、《软件学报》等客座编辑。应邀担任PRICAI'16程序主席、IJCAI'15、ICDM'15、ACML'15等国际会议高级程序委员,以及AAAI'16、NIPS'15、ICML'14等国际会议程序委员。获NSFC优秀青年科学基金(2012年)、教育部新世纪优秀人才支持计划(2013年)等。

王兴刚

华中科技大学

多示例学习简介及其在计算机视觉中的应用

摘要:多示例学习(multi-instance learning, MIL)起源于T. G. Dietterich教授(AAAI现任主席)等人早期在药物活性预测方面的研究,经过近二十年的发展,现已成为机器学习领域的一类重要学习框架。本次报告将简要介绍多示例学习的基本概念与经典算法,讨论多示例学习相关研究问题,并给出多示例学习在计算机视觉中的应用现状。

嘉宾信息:Xinggang Wang is an Assistant Professor in the School of Electronic Information and Communications in Huazhong University of Science and Technology. His research interests are computer vision and machine learning.
He completed his Ph.D. and B.E. in Huazhong University of Science and Technology in 2014 and 2009 respectively. During his Ph.D. period, he visited UCLA and Temple University where he was supervised by Prof. Alan Yuille and Prof. Longin Latecki, respectively. He also worked in the visual computing group in Microsoft Research Asia as an intern, supervised by Prof. Zhuowen Tu and collaborated with Prof. Yi Ma.

山世光

中科院计算所

深度学习进展简介

摘要:本部分将简单介绍2012-2015 深度学习在视觉领域的主要模型进展,作为后续部分的引子。

嘉宾信息: 山世光,博士,中科院计算所研究员、博士生导师,中科院智能信息处理重点实验室常务副主任。主要从事计算机视觉、模式识别、机器学习等相关研究工作,特别是与人脸识别相关的研究工作。迄今已发表CCF A类论文50余篇,全部论文被Google Scholar引用8200余次。曾应邀担任过ICCV,ACCV,ICPR,FG等多个国际会议的领域主席(Area Chair),现任IEEE Trans. on Image Processing,Neurocomputing和Pattern Recognition Letters等国际学术刊物的编委(AE)。研究成果曾获2005年度国家科技进步二等奖和2015年度国家自然科学奖二等奖。他是2012年度基金委“优青”获得者,2015年度CCF青年科学奖获得者。

梁小丹

Sun Yat-sen University

LSTM and its variants for visual recognition

摘要:LSTM Recurrent networks have been first introduced to address the sequential prediction tasks, and then extended to multidimensional image processing tasks such as image generation, object detection, object and scene parsing. It has achieved a big breakthrough on solving kinds of visual recognition tasks benefiting from the long-range memorization of LSTM networks. In this tutorial, I will first introduce the LSTM networks and its variants, and explain their interesting and powerful characteristics in sequential tasks and image processing. Especially, I will focus on explaining why LSTM networks can effectively boost the hierarchical feature representations for RGB and depth images, which is naturally complementary to CNNs. Then I will mainly overview the techniques of extending LSTM networks to kinds of concrete visual recognition tasks.

嘉宾信息:Xiaodan Liang is currently the final year PhD candidate in Sun Yat-sen University. Her supervisor is Prof. Liang Lin. Before that, she got BS degree from Sun Yat-sen University, 2011 under the supervision of Prof. Liang Lin. Her research interest focuses on developing effective deep learning algorithms for object detection and segmentation, semantic segmentation, object parsing, clothes analysis as well as medical imaging analysis. She has published over several IEEE international conference and IEEE journal publications, including TPAMI, TIP, TMI, TMM, CVPR, ICCV, IJCAI, ACM MM etc.

刘昕

中科院计算所

CNN 近期进展及实用技巧

摘要:深度卷积神经网络及深度学习开源算法平台 Caffe 已经成为计算机视觉领域的代表性技术。本报告将首先回顾深度卷积神经网络的基础理论与近期进展情况,并介绍开源深度学习框架 Caffe 的代码架构、实用技巧与新增功能特性。

嘉宾信息:刘昕,中国科学院计算技术研究所人脸识别研究组博士研究生,导师山世光研究员。博士阶段主要从事人脸识别与深度学习技术的研究与工业化应用。作为第一主力或并列第一主力获得 ICCV 2015 年龄估计竞赛亚军、ICCV 2015 文化事件识别竞赛冠军和 2015 年度阿里大规模图像检索竞赛总决赛冠军。

石葆光

华中科技大学

基于 Torch7 的 CNN / RNN 编程及操作基础

摘要:Torch7 是基于 Lua / C++ 编程语言的深度学习开源框架,其特点包括运行速度快、定制能力强、社区资源丰富等,近年来已在学术界和工业界得到了广泛的应用。本报告将介绍 Torch7 的基本语法、数据结构和基本操作,以及使用 Torch7 搭建 CNN / RNN 的方法与技巧。并将介绍 Torch7 中的混合编程方法以及一些实用技巧。

嘉宾信息:石葆光,华中科技大学电子信息与通信学院博士生,导师白翔教授。博士期间主要研究领域包括场景文字识别和三维形状分析。以第一作者身份在 CVPR, PR, ICDAR, SPL 等会议期刊上发表论文数篇,并作为第一主力在 ICDAR 2015 语种识别竞赛上取得亚军。

领域最新进展评论嘉宾介绍

陈云霁

中科院计算所

嘉宾信息:陈云霁,男,1983年生,江西南昌人,中国科学院计算技术研究所研究员,博士生导师,未来计算实验室主任。他带领其团队研制了国际上首个深度学习处理器寒武纪。在此之前,他从事国产处理器的研发工作十余年,先后负责或参与了多款龙芯处理器的设计。他在包括ISCA、ISSCC、HPCA、MICRO、ASPLOS、ICSE、IJCAI、Hot Chips、FPGA、IEEE Micro以及8种IEEE/ACM Trans.在内的学术会议及期刊上发表论文90篇。陈云霁获得了首届国家自然科学基金“优秀青年基金”、首届国家万人计划“青年拔尖人才”、中国计算机学会青年科学家奖以及中科院青年人才奖,入选了MIT Technology Review评选的2015年度全球35位杰出青年创新者。他作为负责人带领科研团队获得了全国“青年文明号”和中央国家机关“青年文明号”的称号。

冯佳时

新加坡国立大学

嘉宾信息:冯佳时现任新加坡国立大学电子与计算机工程系助理教授。2007年6月毕业于中国科学技术大学自动化系,获学士学位。2014年5月于新加坡国立大学获电子与计算机工程博士学位。2014年6月至2015年10月在美国加州大学伯克利分校电子工程与计算机科学系任博士后研究员。主要研究方向是计算机视觉、深度学习、机器学习、在线学习与鲁棒学习。现已在IJCV,CVPR,ICCV,ECCV,ICML,NIPS等计算机视觉与机器学习期刊会议上发表论文50余篇。

胡晓林

清华大学

嘉宾信息:胡晓林2007年在香港中文大学获得自动化与辅助工程专业博士学位,然后在清华大学计算机系从事博士后研究,2009年留校任教至今,目前是计算机系副研究员。他的研究领域包括人工神经网络和计算神经科学,主要兴趣包括大脑处理视听觉信息的机制、功能性核磁共振成像(fMRI)解码、受大脑启发的计算模型以及等。在IEEE Transactions on Neural Networks and Learning Systems, IEEE Transactions on Cybernetics, PLoS ONE, Neural Computation, Journal of Neurophysiology, European Journal of Neuroscience, Frontiers in Human Neuroscience 等国际期刊上发表论文约20篇。他是IEEE Transactions on Neural Networks and Learning Systems的编委(Associate Editor)。

刘越

北京理工大学

嘉宾信息:刘越,博士,北京理工大学光电学院教授,光学工程、软件工程博士生导师,曾先后在美国加州大学伯克利分校、佐治亚理工学院以及澳大利亚国立大学等访问研究,主要研究领域包括虚拟现实与增强现实、自然人机交互以及计算机视觉等,目前主持国家科技支撑计划、国家高技术发展计划(863计划)和国家自然科学基金等多项课题的研究工作,已在知名国际学术会议和期刊上发表论文数十篇,包括ICCV、ECCV以及IEEE Trans等,申请专利30余项。

沈春华

University of Adelaide

嘉宾信息:沈春华博士现任澳大利亚阿德莱德大学计算机科学学院教授(Full Professor)。 2011之前在澳大利亚国家信息通讯技术研究院堪培拉实验室,Richard Hartley领导的计算机视觉组工作近6年。 主持多项科研课题,在重要国际学术期刊和会议发表论文150余篇。 多次担任重要国际学术会议(ICCV, CVPR, ECCV等)程序委员。担任IEEE Transactions on Neural Networks and Learning Systems 副主编。 他曾在南京大学(本科及硕士),澳大利亚国立大学(硕士)学习,并在阿德莱德大学获得计算机视觉方向的博士学位。 2012年被澳大利亚研究理事会(Australian Research Council)授予Future Fellowship。目前主要从事统计机器学习以及计算机视觉领域的研究工作。

谭平

SFU

嘉宾信息:谭平是加拿大西蒙费雷泽大学计算机系副教授。在此之前,他在新加坡国立大学任副教授。他于2007年在香港科技大学获博士学位,并分别于2000年和2003年在上海交通大学获学士及硕士学位。谭平的研究领域是计算机视觉和计算机图形学。他于2012年获得PAMI Young Researcher Award提名奖,以及TR35@Singapore奖。他是IJCV、CGF、MVA等杂志的编委。

王井东

微软亚洲研究院

嘉宾信息:Jingdong Wang is a Lead Researcher at the Visual Computing Group, Microsoft Research Asia. His areas of interest include computer vision, multimedia, and machine learning. At present, he is mainly working on image search including interactive image search, indexing and compact coding for large scale similarity search, and visual understanding including (fine-grained) image recognition, salient object detection, person re-identification, and image segmentation.
He has published 100+ papers in top conferences and prestigious international journals, such as CVPR, ICCV, ACMMM, ICML, SIGIR, TPAMI, IJCV, and so on, and one book. He has served as an area chair in ECCV 2016, ACMMM 2015 and ICME 2015, a track chair in ICME 2012, a special session chair in ICMR 2014, and a program committee member or a reviewer in top conferences and journals, including CVPR, ICCV, ACMMM, NIPS, SIGIR, SIGGRAPH, TPAMI, IJCV. He has shipped dozens technologies to Microsoft products, including Bing image search, Project Oxford, and XiaoIce.

徐东

悉尼大学

嘉宾信息:徐东博士于2001年和2005年在中国科学技术大学取得学士和博士学位, 目前担任悉尼大学电子与信息工程学院教授 (Chair in Computer Engineering)。徐东教授曾在微软亚洲研究院、香港中文大学和美国哥伦比亚大学从事研究工作,并在新加坡南洋理工大学任教。徐东教授的研究领域包括计算机视觉、多媒体信号处理、机器学习以及医学图像处理等领域做出了重要贡献。徐东教授在IEEE Transactions上发表了60余篇期刊论文和多篇国际会议论文, 其中两篇论文于2014年和2010年分别获得IEEE T-MM最佳论文奖和IEEE CVPR 最佳学生论文奖。徐东教授目前担任IEEE T-PAMI, T-NNLS和T-CSVT等学术期刊编委, ICME和VALSE (视觉与学习青年学者研讨会)指导委员会成员, 以及ICPR2016 Track Chair和ECCV2016 Area Chair, 曾担任IEEE T-NNLS, T-CYB, T-CSVT, IEEE Multimedia, IJCV和 ACM TOMM 等国际期刊的客座主編,以及ICME 2014程序委员会协同主席和CVPR 2012 Area Chair。

薛建儒

西安交通大学

嘉宾信息:工学博士,教授,长江学者特聘教授。现在西安交通大学人工智能与机器人研究所从事教学科研工作。主要研究领域为视觉信息处理及应用、无人车环境感知及智能控制。入选年度教育部“新世纪优秀人才计划”、西安交通大学“腾飞人才计划”特聘教授、“青年拔尖人才支持计划”等人才计划。获IEEE ITS学会杰出研究团队奖、国家技术发明二等奖、高等学校优秀科学研究成果自然科学一等奖、陕西省青年科技奖等奖项。合著英专著《Statistical Learning and Pattern Analysis Approaches to Image and Video Processing》(Springer出版,2009年),在本领域IEEE汇刊(TIP、TSMCB)及PR等国际期刊及ICCV、ECCV、ACM MM、DCC等国际会议发表论文100余篇。

钟燕飞

武汉大学

嘉宾信息:钟燕飞,武汉大学“珞珈特聘”教授,博士生导师,全国百篇优博获得者,教育部新世纪优秀人才,IEEE Senior Member。主要从事遥感信息处理与应用方向的研究,主持国家自然科学基金、863计划等项目。在国内外发表科研论文100余篇,在遥感、模式识别领域的权威期刊IEEE TGRS/TSMCB/JSTARS/JSTSP、ISPRS P&RS、PR、RS等发表SCI论文45篇,入选2014年ESI热点论文。提出的高分辨率遥感数据分类方法获IEEE地球科学与遥感学会( GRSS) 2013年度数据融合大赛亚军(共50余个参赛团体)。获批国家发明专利3项;获湖北省自然科学一等奖、教育部科技进步一等奖;入选教育部创新团队骨干成员。 任IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing(IF=3.026)和International Journal of Remote Sensing (IF=1.652)期刊副主编(Associate Editor)。