| 2023年01月06日 (星期五) 晚上20:00 (北京时间) | | 铂金赞助商Webinar 特别感谢:图森未来、华为、OPPO、真格基金对VALSE的赞助! | | | | https://live.bilibili.com/22300737 |
报告嘉宾:黄泽昊 (图森未来) 报告题目:基于Predictor的神经网络结构搜索方法及其在自动驾驶中的应用 报告嘉宾:王峰 (图森未来) 报告题目:全稀疏3d检测器 报告嘉宾:谢凌曦 (华为) 报告题目:华为云盘古视觉基础模型的挑战难题发布 报告嘉宾:秦征 (OPPO) 报告题目:用户体验驱动的影像之美 报告嘉宾:冯展鹏 (深圳云天励飞技术股份有限公司) 报告题目:Towards Automated Artificial Intelligence 报告嘉宾:张号逵 (深圳云天励飞技术股份有限公司) 报告题目:ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer
注:真格基金是深圳云天励飞技术股份有限公司的投资人。 *欢迎大家在下方留言提出主题相关问题,主持人和panel嘉宾会从中选择若干热度高的问题加入panel议题!
报告嘉宾:黄泽昊 (图森未来) 报告时间:2023年01月06日 (星期五)晚上20:00 (北京时间) 报告题目:基于Predictor的神经网络结构搜索方法及其在自动驾驶中的应用 报告人简介: 黄泽昊,本科毕业于北京航空航天大学,现为图森未来算法工程师,从事目标检测、神经网络搜索等技术的研发工作,曾在计算机视觉领域发表多篇论文,包括CVPR,ICCV,ECCV等。
个人主页: https://scholar.google.com/citations?user=zXqeKPgAAAAJ&hl=en
报告摘要: 本报告将介绍一种基于Predictor的神经网络结构搜索方法,通过将神经网络视为一种对网络的性能评价函数,给定一个网络结构,我们可以通过简单的梯度上升方式来对其进行优化从而获得更好的网络搜索结果。我们的实验证明,只需要几十个训练样本,该方法即可实现与SOTA方法对比的性能。我们在ImageNet\MSCOO任务上分别与RegNet、YOLOX进行了对比,验证了该方法的有效性。同时,我们也将该方法应用到了自动驾驶任务中,分别在Waymo以及公司内部的3D检测数据集上取得了比baseline方法更优的性能。
参考文献: [1] Yuan, Liuchun, Zehao Huang, and Naiyan Wang. "PredNAS: A Universal and Sample Efficient Neural Architecture Search Framework." arXiv preprint arXiv:2210.14460 (2022).
报告嘉宾:王峰 (图森未来) 报告时间:2023年01月06日 (星期五)晚上20:15 (北京时间) 报告题目:全稀疏3d检测器 报告人简介: 王峰,图森未来感知算法研究员。博士毕业于电子科技大学,目前在图森未来负责LiDAR感知模块研发。博士期间从事人脸识别算法研究,发明的NormFace、AMSoftmax算法被广泛应用于商业人脸识别系统中。加入图森后从事感知算法研发工作。在CVPR、ICCV、TIP、NN等国际会议和期刊上发表多篇文章,他引2000余次。
个人主页: http://happynear.wang
报告摘要: As the perception range of LiDAR expands, LiDAR-based 3D object detection contributes ever-increasingly to the long-range perception in autonomous driving. Mainstream 3D object detectors often build dense feature maps, where the cost is quadratic to the perception range, making them hardly scale up to the long-range settings. To enable efficient long-range detection, we first propose a fully sparse object detector termed FSD. FSD is built upon the general sparse voxel encoder and a novel sparse instance recognition (SIR)module. SIR groups the points into instances and applies highly-efficient instance-wise feature extraction. The instance-wise grouping sidesteps the issue of the center feature missing, which hinders the design of the fully sparse architecture. To further enjoy the benefit of fully sparse characteristic, we leverage temporal information to remove data redundancy and propose a super sparse detector named FSD++. FSD++ first generates residual points, which indicate the point changes between consecutive frames. The residual points, along with a few previous foreground points, form the super sparse input data, greatly reducing data redundancy and computational overhead. We comprehensively analyze our method on the large-scale Waymo Open Dataset, and state-of-the-art performance is reported. To showcase the superiority of our method in long-range detection, we also conduct experiments on Argoverse 2 Dataset, where the perception range (200m)is much larger than Waymo Open Dataset (75m).
参考文献: [1] Fan, L., Wang, F., Wang, N., & Zhang, Z. (2022). Fully Sparse 3D Object Detection. arXiv preprint arXiv:2207.10035.
报告嘉宾:谢凌曦 (华为) 报告时间:2023年01月06日 (星期五)晚上20:30 (北京时间) 报告题目:华为云盘古视觉基础模型的挑战难题发布 报告人简介: 谢凌曦博士目前是华为公司的高级研究员。他分别于2010年和2015年于清华大学获得本科和博士学位,并且于2015年至2019年期间在美国加州大学洛杉矶分校和约翰霍普金斯大学担任博士后研究员。谢凌曦博士的研究兴趣覆盖计算机视觉的各个方向,主要包括统计学习方法和深度学习模型的应用。他的研究工作覆盖图像分类、物体检测、语义分割和其他视觉任务,并积极推动自动机器学习算法在上述领域的应用。谢凌曦博士已经在国际顶级的学术会议和期刊上发表超过90篇论文,谷歌学术引用超过8000次。他于2015年获得清华大学优秀博士论文奖,并于ICMR2015会议上获得最佳论文奖。
报告摘要: 随着人工智能加速进入千行百业,计算机视觉算法亟需适配到不同应用场景中去,然而不同场景的性质差异大大增加了算法适配的成本。为此,华为云提出盘古视觉基础模型,打造上游预训练结合下游微调的框架,以缓解碎片化应用开发的现状,促进计算机视觉的工业化新开发范式。本次报告将重点分析上述框架所面临的挑战以及盘古团队的应对策略,并在此基础上提出若干难题,期待与业界学者们共同探讨和解决。
报告嘉宾:秦征 (OPPO) 报告时间:2023年01月06日 (星期五)晚上21:00 (北京时间) 报告题目:用户体验驱动的影像之美 报告人简介: OPPO公司产学研事务部部长,曾任腾讯高校合作总监、英特尔 (中国)有限公司企业事务经理等职务。他主要负责推动与大学、政府、学会之间的合作,致力于推动企业与高校和科研院所通过产学合作进行原始创新和产业升级、推动科研成果产业化、提升教育教学质量,激发学生创新以及提升就业和创业技能。同时,他是中国计算机学会 (CCF)的第十二届理事,Yocsef委员,高性能计算专委会通讯委员,也是计算机学会 (ACM)的首届中国教育委员会成员。 秦征先生职业生涯中,课程开发、高性能计算、教育信息化、智能硬件、科技创业、教育以及通讯技术领域。在加入OPPO之前,他在教育领域有超过十年的工作经验。秦征先生的职业生涯经历了政府、大学、国有公司、跨国公司,创业企业等许多机构,并涵盖了诸如计算机、设计、机械、建筑和城市规划以及信息安全等的诸多领域。
报告嘉宾:冯展鹏 (深圳云天励飞技术股份有限公司) 报告时间:2023年01月06日 (星期五)晚上21:30 (北京时间) 报告题目:Towards Automated Artificial Intelligence 报告人简介: 冯展鹏,深圳云天励飞技术股份有限公司高级算法工程师,毕业于美国乔治梅森大学,回国后加入云天励飞从事算法工程师一职。在云天励飞工作期间主导多个公司重大项目的算法研发工作,带领研发团队在短短的半年内批量生产100种可落地的高精度长尾算法,并将算法生产经验进行沉淀总结成程序化的算法生产工具,提高算法生产效率2.5倍,同时将算法开发所需的硬件、时间成本降至原来一半。 工作期间共发表专利10篇,以第一作者的身份发表国际顶级计算机视觉会议论文一篇 (已收录),以共同作者的身份协助同事发表顶级计算机视觉会议论文一篇 (已收录)。
报告嘉宾:张号逵 (深圳云天励飞技术股份有限公司) 报告时间:2023年01月06日 (星期五)晚上21:45 (北京时间) 报告题目:ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer 报告人简介: 张号逵,博士,深圳云飞励飞技术股份有限公司资深算法研究员,研究领域包括网络结构搜索,深度估计,信息检索及高光谱图像分类。2021毕业于西北工业大学计算机学院。2018年至2020年,在澳洲阿德莱德大学计算机学院CSC联合培养,师从沈春华教授。 在国际权威期刊发表论文20余篇,SCI检索14篇,中科院分区Top 期刊 6 篇,顶会5篇,ESI高被引5篇,一篇论文入选“领跑者5000”项目,授权专利 8项,谷歌索引 1900余次。目前是多个国际顶级期刊及会议的审稿人,包括TPAMI, CVPR, ICCV, ECCV, AAAI, IEEE TGRS, IEEE TCSVT等。 特别鸣谢本次Webinar主要组织者: 主办AC:姬艳丽 (电子科技大学) 1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们! 直播地址: https://live.bilibili.com/22300737; 历史视频观看地址: https://space.bilibili.com/562085182/ 2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ S群,群号:317920537);
*注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。 3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。 4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。 |