VALSE

VALSE 首页 活动通知 查看内容

VALSE Webinar 25-07期 总第378期 可控视频生成及其应用

2025-3-22 20:37| 发布者: 程一-计算所| 查看: 15| 评论: 0

摘要: 报告嘉宾:朱霖潮 (浙江大学)报告题目:智能视频生成与编辑:技术突破与未来挑战报告嘉宾:王鑫涛 (快手)报告题目:视频生成技术的Scaling Law与精准控制报告嘉宾:朱霖潮 (浙江大学)报告时间:2025年3月26日 (星期 ...

报告嘉宾:朱霖潮 (浙江大学)

报告题目:智能视频生成与编辑:技术突破与未来挑战


报告嘉宾:王鑫涛 (快手)

报告题目:视频生成技术的Scaling Law与精准控制


报告嘉宾:朱霖潮 (浙江大学)

报告时间:2025年3月26日 (星期三)晚上20:00 (北京时间)

报告题目:智能视频生成与编辑:技术突破与未来挑战


报告人简介:

朱霖潮,浙江大学计算机科学与技术学院百人计划研究员、博士生导师,入选国家级青年人才项目,获首届谷歌学术研究奖 (2021)等荣誉。主要研究方向为人工智能、AI4S、人工智能通用基础模型等。曾获得CVPR多智能体行为建模竞赛冠军等8项国际竞赛冠军。曾担任NeurIPS、CVPR、ECCV、ICIP、PRCV等会议领域主席,并多次在国际会议上组织专题研讨会。


个人主页:

https://ffmpbgrnn.github.io/

 

报告摘要:

本报告探讨智能视频生成与编辑技术的最新技术进展及突破。基于扩散模型与Transformer架构的视频生成技术取得显著突破,为视频创作流程带来变革。报告重点阐述长时序视频生成的关键算法改进、多模态条件控制机制、跨帧特征一致性优化方法以及属性解耦编辑的技术实现。剖析当前视频生成面临的技术挑战,包括时空一致性维持困难、长程依赖建模不足、细节保真度不高等关键问题,并提出基于注意力机制改进、时序信息编码优化等解决思路。


报告嘉宾:王鑫涛 (快手)

报告时间:2025年3月26日 (星期三)晚上20:30 (北京时间)

报告题目:视频生成技术的Scaling Law与精准控制


报告人简介:

王鑫涛,快手专家研究员,本科毕业于浙江大学,博士毕业于香港中文大学 MMLab,曾任腾讯 ARC Lab 和 AI Lab专家研究员。主要研究视觉生成,包括图像、视频和 3D 的生成与可控。在国际顶级会议期刊发表多篇文章,论文 Google Scholar 引用 20000 余次,被评选为世界前2%顶尖科学家。


个人主页:

https://xinntao.github.io/

 

报告摘要:

视频生成技术的发展日新月异,自Sora模型问世以来,可灵、Veo2等模型不断提升效果,推动着这一领域的快速进步。本报告将重点分享可灵团队的最新研究成果和挑战,主要包含三个方面。首先,我们将简要探讨视频生成领域的Scaling Law。正如大型语言模型LLM中的Scaling Law已为业界所熟知,我们的研究《Towards Precise Scaling Laws for Video Diffusion Transformers》系统性地研究了视频生成领域的缩放规律,并探讨其带来的启发。其次,在控制生成方面,我们将介绍一系列创新性的探索性工作。这些研究,包括SynCamMaster和ReCamMaster等项目,致力于为用户提供更精确、更灵活的视频生成控制能力,拓展技术的应用空间。最后,我们将着眼于视频生成领域面临的前沿挑战,简要介绍学界的一些初步探索。


主持人:郭青 (新加坡科技研究局 (A*STAR))


主持人简介:

郭青,新加坡科技研究局 (A*STAR)前沿人工智能研究中心资深研究员,新加坡国立大学兼职助理教授,独立PI,入选斯坦福全球Top2%科学家。2019年加入新加坡南洋理工大学聘为博士后研究员,并于2020年获的瓦伦堡-南洋理工大学校长博士后奖学金。主要从事计算机视觉及人工智能安全相关方向的研究,在TPAMI,IJCV,ICML,NeurIPS等A类会议及期刊上发表论文60余篇。目前担任ICML,ICLR,ICCV, IJCAI 领域主席,AAAI Senior PC,VALSE2023 执行AC, IEEE Conference on AI (CAI)2024 联合主席。


个人主页:

https://tsingqguo.github.io/



特别鸣谢本次Webinar主要组织者:

主办AC:郭青 (新加坡科技研究局)

协办AC:林迪 (天津大学)

小黑屋|手机版|Archiver|Vision And Learning SEminar

GMT+8, 2025-10-16 17:29 , Processed in 0.013138 second(s), 14 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部