VALSE

VALSE 首页 活动通知 查看内容

VALSE 论文速览 第121期:物理推理中的学习机制

2023-8-9 10:11| 发布者: 程一-计算所| 查看: 300| 评论: 0

摘要: 为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速 ...

为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自北京大学的物理推理 (Physical Reasoning)的工作。该工作由朱毅鑫老师指导,论文由李世乾同学录制。


论文题目:物理推理中的学习机制

作者列表:

李世乾 (北京大学)、武可雯 (清华大学)、张驰  (BIGAI)、朱毅鑫 (北京大学)

B站观看网址:

https://www.bilibili.com/video/BV1Sr4y1o7SS/



论文摘要:

动态预测是物理推理不可缺少的吗?如果是,动态预测模块在物理推理过程中扮演什么样的角色?大多数研究都专注于设计动态预测网络,将物理推理作为下游任务,而没有考察上述问题,想当然地认为设计的动态预测无疑有助于推理过程。在这项工作中,我们仔细研究了这一假设,通过比较两种学习机制:从动态中学习 (LfD)和从直觉中学习 (LfI)来探索这一基本假设。在第一个实验中,我们直接检查并比较了这两种机制。结果显示了一个令人惊讶的发现:简单LfI优于或与最先进的LfD相当。这一观察结果引出了第二次对ground-truth动态轨迹 (GD)进行的实验,这是LfD的理想情况,其中动态轨迹直接从模拟器获得。结果表明,在物理推理中,如果直接给出动态,而不是近似地给出动态,将比单独使用LfI获得更高的性能;这实际上是性能的上限。但在实际应用中,LfD机制只能通过模仿物理规律的动态轨迹学习模块来预测近似动态(Approximate Dynamics, AD),使得后续的物理推理模块退化为LfI范式;请看第三个实验。我们注意到这个问题很难缓解,因为动态预测误差不可避免地在长期范围内积累。最后,在第四个实验中,我们注意到Lfl,这个极其简单的策略,如果使用得当,在学习解决物理推理问题时更有效。综上所述,在PHYRE这一具有挑战性的基准上的结果表明,LfI即使不是更好,也与有花哨设计的LfD一样好。然而,尽管具有挑战性,但尝试改善LfD的仍然可能获得性能上的提升。


论文信息:

[1] S. Li, K. Wu, C. Zhang and Y. Zhu. On the Learning Mechanisms in Physical Reasoning. In NeurIPS, 2022.


论文链接:

[https://arxiv.org/abs/2210.02075]


代码链接:

[https://github.com/lishiqianhugh/LfID]


视频讲者简介:

李世乾,北京大学智能学院博士研究生,师从朱毅鑫老师,主要研究方向为认知推理,直觉物理等。



特别鸣谢本次论文速览主要组织者:

月度轮值AC:汪婧雅 (上海科技大学)、刘宇 (大连理工大学)


活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们!

直播地址:

https://live.bilibili.com/22300737;

历史视频观看地址:

https://space.bilibili.com/562085182/ 


2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ S群,群号:317920537);


*注:申请加入VALSE QQ群时需验证姓名、单位和身份缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。


3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。


4您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。


小黑屋|手机版|Archiver|Vision And Learning SEminar

GMT+8, 2024-12-4 02:12 , Processed in 0.012135 second(s), 14 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部