20211222-33 总第262期自动驾驶中的机器视觉与学习问题

2021-12-20 18:21| 发布者: 程一-计算所| 查看: 1878| 评论: 0

摘要: 报告时间2021年12月22日 (星期三)晚上20:00 (北京时间)主题自动驾驶中的机器视觉与学习问题主持人王乃岩 (图森未来)直播地址https://live.bilibili.com/22300737报告嘉宾：陈启峰(香港科技大学)报告题目：Safety-aw ...

报告时间	2021年12月22日 (星期三) 晚上20:00 (北京时间)
主题	自动驾驶中的机器视觉与学习问题
主持人	王乃岩 (图森未来)
直播地址	https://live.bilibili.com/22300737

报告嘉宾：陈启峰 (香港科技大学)

报告题目：Safety-aware Prediction and Planning in Autonomous Driving

报告嘉宾：赵行 (清华大学)

报告题目：环视自动驾驶感知

Panel嘉宾：

陈启峰 (香港科技大学)、赵行 (清华大学)、余轶南 (地平线)、韩旭 (文远知行WeRide)

Panel议题：

1. 从技术角度上来说，目前自动驾驶仍然存在的技术难点在哪里？从学术研究的角度来看，有哪些值得投入的方向？

2. 如何看待最近流行的大模型，在自动驾驶中大模型会改变现有的模型范式吗？

3. 如何看到自动驾驶中的不同路线之争？渐进式 v.s. 直接式，各自有什么优劣和可取之处？

4. 自动驾驶研发中，学术界和产业界各自应当如何分工？

*欢迎大家在下方留言提出主题相关问题，主持人和panel嘉宾会从中选择若干热度高的问题加入panel议题！

报告嘉宾：陈启峰 (香港科技大学)

报告时间：2021年12月22日 (星期三)晚上20:00 (北京时间)

报告题目：Safety-aware Prediction and Planning in Autonomous Driving

报告人简介：

Qifeng Chen is an assistant professor of the Department of Computer Science and Engineering and the Department of Electronic and Computer Engineering at The Hong Kong University of Science and Technology. He received his Ph.D. in computer science from Stanford University in 2017. His research interests include image processing and synthesis, 3D vision, and autonomous driving. He was named one of 35 Innovators under 35 in China in 2018 by MIT Technology Review. He won the Google Faculty Research Award 2018. He won the 2nd place worldwide at the ACM- ICPC World Finals in 2011 and a gold medal in IOI 2007. He co-founded the startup Lino in 2017.

个人主页：

https://cqf.io/

报告摘要：

Safety is always a critical factor in autonomous driving, and I will present approaches to safety-aware prediction and planning in this talk. Motion prediction of vehicles is critical but challenging due to the uncertainties in complex environments and the limited visibility caused by occlusions and limited sensor ranges. First, we present a new task, safety-aware motion prediction with unseen vehicles for autonomous driving, where we aim at predicting an occupancy map that indicates the earliest time when each location can be occupied by either seen or unseen vehicles. Second, we introduce a novel prediction framework called PRIME, which stands for Prediction with Model-based Planning. PRIME guarantees the trajectory feasibility by exploiting a model-based generator to produce future trajectories under explicit constraints for safety and enables accurate multimodal prediction by utilizing a learning-based evaluator to select future trajectories.

参考文献：

[1] Xuanchi Ren, Tao Yang, Li Erran Li, Alexandre Alahi, and Qifeng Chen, “Safety-aware Motion Prediction with Unseen Vehicles for Autonomous Driving,” International Conference on Computer Vision (ICCV), 2021

[2] Haoran Song, Di Luan, Wenchao Ding, Michael Yu Wang, and Qifeng Chen, “Learning to Predict Vehicle Trajectories with Model-based Planning,” Conference on Robot Learning (CoRL), 2021

报告嘉宾：赵行 (清华大学)

报告时间：2021年12月22日 (星期三)晚上20:30 (北京时间)

报告题目：环视自动驾驶感知

报告人简介：

赵行，现任清华大学交叉信息研究院助理教授，博士生导师。他的主要研究兴趣包多模态学习，自动驾驶，计算机视觉。在此之前，赵行在麻省理工学院MIT取得了博士学位，后于谷歌无人车项目Waymo担任研究科学家，提出了一系列运动预测中的框架性工作。赵行博士的工作曾被多家主流科技媒体报道，如BBC, NBC, 麻省理工科技评论等。他的论文获得了2015年ICCP最佳论文奖。他本人入选了2020年福布斯中国U30科学精英榜。

个人主页：

https://hangzhaomit.github.io/

报告摘要：

自动驾驶视觉感知的一大挑战是根据前视的相机图像来估计三维世界的环境状态。在自动驾驶领域，该问题被称为鸟瞰图感知 (BEV Perception)。在本次分享中，我们将讨论用环视视觉来解决两个重要问题：1.在线语义高精度建图问题；2.单目三维目标检测。在高精度地图建图方面，我们提出了HDMapNet，它仅利用车载的传感器就能做实时的语义地图重建，摆脱了自动驾驶对于预建高精度地图的要求。在单目三维目标检测方面，我们提出了DETR3D，它利用3D到2D的查询 (query)，实现了高效和出色的三维检测效果。

参考文献：

[1] Qi Li, Yue Wang, Yilun Wang, Hang Zhao, HDMapNet: An Online HD Map Construction and Evaluation Framework.

https://arxiv.org/abs/2107.06307

[2] Yue Wang, Vitor Campagnolo Guizilini, Tianyuan Zhang, Yilun Wang, Hang Zhao, Justin Solomon, DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries, CoRL 2021.

https://openreview.net/pdf?id=xHnJS2GYFDz

Panel嘉宾：韩旭 (文远知行WeRide)

嘉宾简介：

韩旭，文远知行WeRide创始人兼CEO。文远知行WeRide是全球领先的L4级自动驾驶科技公司，估值达33亿美金。

韩旭是计算机视觉和机器学习领域的顶级科学家，是率先投入无人驾驶技术研发及商业化的中国学者。他曾担任美国密苏里大学终身教授，在创立文远知行前，是百度自动驾驶事业部首席科学家。他参与领导开发的DeepSpeech2 (语音识别系统)被MIT Tech Review (麻省理工科技评论)评为2016十大技术突破之一。

韩旭拥有伊利诺伊大学香槟分校计算机工程博士学位。

Panel嘉宾：余轶南 (地平线)

嘉宾简介：

余轶南，博士，地平线 (Horizon Robotics)副总裁，自动驾驶产品总经理。2015年加入地平线，是地平线早期创始团队成员，负责自动驾驶方向的研发和产品工作，成功主持了Matrix自动驾驶计算平台的研发，并在感知决策算法、多传感器融合、高精地图与定位、仿真测试、海量数据处理等方面积累了丰富的产品和研发经验。

2012年毕业于中科院自动化所，师从谭铁牛院士，获博士学位。2015年完成百度-清华联合培养博士后，导师为张长水、余凯。长期从事计算机视觉、机器学习、自动驾驶等方面的研究。在百度工作期间，负责百度IDL基础视觉技术的研发工作，在深度学习的通用视觉识别、检测、分割、检索和商业图像识别等领域取得突破性进展，极大地推动了计算机视觉技术在自动驾驶领域的成功应用。拥有丰富的研究与管理经验，余轶南在读书和工作期间曾获多项国际荣誉，包括PASCAL VOC 2010和2011年视觉目标检测竞赛冠军，在百度工作期间，两次获得公司最高荣誉——“百度最高奖”。

主持人：王乃岩 (图森未来)

主持人简介：

王乃岩，现为北京图森未来科技有限公司首席科学家，负责北京算法研发团队从事L4级别自动驾驶重卡的研发。在这之前，他于2011年本科毕业于浙江大学，2015年博士毕业于香港科技大学计算机科学与工程系。他是2014 Google PhD Fellow计划入选者 (全球38名)，多次在国际数据挖掘和计算机视觉比赛中名列前茅。他发表的论文据Google Scholar统计总引用次数超过10000余次。

他的主要研究方向为计算机视觉与机器学习，特别在于将统计计算模型应用到这两者的实际问题中去。他不断追踪和改进学术界中最前沿的技术，并集成进入图森的自动驾驶卡车中部署运行。

个人主页：

http://winsty.net

特别鸣谢本次Webinar主要组织者：

主办AC：王乃岩 (图森未来)

活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行，欢迎在B站搜索VALSE_Webinar关注我们！

直播地址：

https://live.bilibili.com/22300737；

历史视频观看地址：

https://space.bilibili.com/562085182/

2、VALSE Webinar活动通常每周三晚上20:00进行，但偶尔会因为讲者时区问题略有调整，为方便您参加活动，请关注VALSE微信公众号：valse_wechat 或加入VALSE QQ R群，群号：137634472）；